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第 一 划 使 用 函数 构建 抽象 


1.1 引言 


来 源 : 1.1 Introduction 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


计算 机 科学 是 一 个 极其 宽泛 的 学 科 。 全 球 的 分 布 式 系统 、 人 工 智能 、 机 器 人 、 图 形 、 安 全 、 
科学 计算 ， 计 算 机 体系 结构 和 许多 新 兴 的 二 级 领域 ， 人 ° 
计算 机 科学 的 快速 发 展 广泛 影响 了 人 类 生活 。 商 业 、 通 信 、 科 学 、 艺 术 、 休 闲 和 政治 都 被 计 
算 机 领域 彻底 改造 。 

计算 机 科学 的 巨大 生产 力 可 能 只 是 因为 它 构 建 在 一 系列 优雅 且 强 大 的 基础 概念 上 。 Wun 
都 以 表达 人 信息、 指定 处 理 它 所 需 的 逻辑 、 以 及 设计 管理 逻辑 复杂 性 的 抽象 作为 开始 。 对 这 
基础 的 掌握 需要 我 们 精确 理解 计算 机 如 何 解释 程序 以 及 执行 计算 过 程 。 


这 些 基础 概念 在 伯克利 长 期 教授 ， 使 用 由 Harold Abelson、Gerald ay Sussman 和 Julie 
Sussman 创 作 的 经 典 教 科 书 《计算 机 科学 的 构造 与 解释 》 (SICP) 。 这 个 讲义 大 量 借 鉴 了 这 
本 书 ， 原 作者 慷慨 地 使 它 可 用 于 改编 和 复 用 。 


我 们 的 智力 之 旅 一 旦 出 发 就 不 能 回头 了 ， 我 们 也 永远 都 不 应 该 对 此 有 所 期 待 。 


我 们 将 要 学 习 计 算 过 程 的 概念 。 计 算 过 程 是 计算 机 中 的 抽象 事物 。 在 演化 中 ， 过 程 操纵 
着 叫做 数据 的 其 它 事 物 。 过 程 的 演化 由 叫做 程序 的 一 系列 规则 主导 。 人 们 创造 程序 来 主 
导 过 程 。 实 际 上 ， 我 们 使 用 我 们 的 絮语 来 凭空 创造 出 计算 机 的 灵魂 。 


我 们 用 于 创造 过 程 的 程序 就 像 巫 师 的 魔法 。 它 们 由 一 些 十 怪 且 深奥 的 编程 语言 中 的 符号 
表达 式 所 组 成 ， 这 些 语言 指定 了 我 们 想 让 过 程 执行 的 任务 。 


在 一 台 工 作 正 确 的 计算 机 上 ， 计 算 过 程 准 确 且 严谨 地 执行 程序 。 所 以 ， 就 像 耿 师 的 学 徒 
那样 ， 程 序 员 新 手 必须 学 会 理解 和 预测 他 们 的 魔法 产生 的 结果 


--Abelson & Sussman, SICP (1993) 


1.1.1 在 Python 中 编程 
吾 言 并 不 是 你 学 到 的 东西 ， 而 是 你 参与 的 东西 。 


--Arika Okrent 
语言 ， 最 好 是 一 种 许多 人 和 大 量 计 算 机 都 能 懂 的 语 
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为 了 定义 计算 过 程 ， 我 们 需要 一 种 编程 
言 。 这 门 课 中 ， 我 们 将 会 使 用 Python 语言 


Python 是 一 种 广泛 使 用 的 编程 语言 ， 并 且 在 许多 职业 中 都 有 它 的 爱好 者 : Web 程 序 员 、 游 戏 
工程 师 、 科 学 家 、 学 者 ， 其 至 新 编程 语言 的 设计 师 。 当 你 学 习 Python 时 ， 你 就 加 入 到 了 一 个 
数 百 万 人 的 开发 者 社 群 。 开 发 者 社 群 是 一 个 极其 重要 的 组 织 : 成 员 可 以 互相 帮助 来 解决 问 
题 ， 分 享 他 们 的 代码 和 经 验 ， 以 及 一 起 开发 软件 和 工具 。 投 入 的 成 员 经 常 由 于 他 们 的 贡献 而 
出 名 ， 并 且 收 到 广泛 的 尊重 。 也 许 有 一 天 你 会 被 提名 为 Python 开 发 者 精英 。 


Python 语言 自身 就 是 一 个 大 型 志愿 者 社 群 的 产物 ， 并 且 为 其 贡献 者 的 多 元 化 而 自豪 。 这 种 语 
言 在 20 世 纪 80 年 代 末 由 Guido van Rossum 设 计 并 首次 实现 。 他 的 Python3 教 程 的 第 一 章 解释 
了 为 什么 Python 在 当今 众多 语言 之 中 如 此 流行 。 


Python 适用 于 作为 教学 语言 ， 因 为 纵 观 它 的 历史 ，Python 的 开发 者 强调 了 Python 代码 对 人 类 
的 解释 性 ， 并 在 Python 之 禅 中 美观 、 简 约 和 可 读 的 原则 下 进一步 加 强 。Python 尤 其 适用 于 课 
堂 ， 因 为 它 宽 泛 的 特性 支持 大 量 的 不 同 编程 风格 ， 我 们 将 要 探索 它们 。 在 Python 中 编程 没有 
单一 的 解法 ， 但 是 有 一 些 习 俗 在 开发 者 社 群 之 间 流 传 ， 它 们 可 以 使 现 有 程序 的 阅读 、 理 解 ， 
以 及 扩展 变 得 容易 。 所 以 ，Python 的 灵活 性 和 多 学 性 的 组 合 可 以 让 学 生 们 探索 许多 编程 范 
式 ， 之 后 将 它们 新 学 到 的 知识 用 于 数 千 个 正在 开发 的 项 目 中 。 


这 些 讲 义 通过 使 用 抽 痊 设计 的 技巧 和 严谨 的 计算 模型 ， 来 快速 介绍 Python 的 特性 。 此 外 ， 这 
些 讲义 提供 了 Python 编 程 的 实践 简介 ， 和 包含 一 些 高 级 语言 特性 和 展示 示例 。 通 过 这 门 课 ， 学 
习 Python 将 会 变 成 自然 而 然 的 事情 。 


然而 ，Python 是 一 门生 态 丰富 的 语言 ， 带 有 大 量 特性 和 用 法 。 我 们 讲 到 基本 的 计算 机 科学 概 
念 时 ， 会 刻意 慢 慢 地 介绍 他 们 。 对 于 有 经 验 的 学 生 ， 他 们 打算 一 口气 学 完 语言 的 所 有 细节 ， 

我 们 推荐 他 们 阅读 Mark Pilgrim 的 书 Dive Into Python 3， 它 在 网 上 可 以 免费 阅读 。 这 本 书 的 主 
题 跟 这 门 课 极 其 不 同 ， 但 是 这 本 书包 含 了 许多 关于 使 用 Python 的 宝贵 的 实用 信息 。 事 先 告 

知 : 不 像 这 些 讲义 ，Dive Into Python 3 需要 一 些 编程 经 验 。 


开始 在 Python 中 编程 的 最 佳 方法 就 是 直接 和 解释 器 交互 。 这 一 章 会 描述 如 何 安装 Python3， 使 
用 解释 器 开始 交互 式 会 话 ， 以 及 开始 编程 。 


1.1.2 安装 Python3 


就 像 所 有 伟大 的 软件 一 样 ，Python 具 有 许多 版 本 。 这 门 课 会 使 用 Python3 最 新 的 稳定 版 本 (本 
书 编写 时 是 3.2) 。 许 多 计算 机 都 已 经 安装 了 Python 的 旧版 本 ， 但 是 它们 可 能 不 满足 这 门 课 。 
你 应 该 可 以 在 这 门 课 上 使 用 任何 能 安装 Python3 的 计算 机 。 不 要 担心 ，Python 是 免费 的 。 


Dive Into Python 3 拥有 一 个 为 所 有 主流 平台 准备 的 详细 的 安装 指南 。 这 个 指南 多 次 提 到 了 
Python3.1， 但 是 你 最 好 安装 3.2 (虽然 它们 的 差异 在 这 门 课 中 非常 微小 ) 。EECS 学 院 的 所 有 
教学 机 都 已 经 安装 了 Python3.2。 


1.1.3 交互 式 会 话 


在 Python 交互 式 会 话 中 ， 你 可 以 在 提示 符 >>> 之 后 键入 一 些 Python 代 码 。Python 解 释 器 读 取 

并 求 出 你 输入 的 东西 ， 并 执行 你 的 各 种 命令 。 

有 几 种 开始 交互 式 会 话 的 途径 ， 并 且 具 有 不 同 的 特性 。 把 它们 尝试 一 遍 来 找 出 你 最 喜欢 的 方 

式 。 它 们 全 部 都 在 背后 使 用 了 相同 的 解释 器 (CPython) 。 

。 最 简单 且 最 普遍 的 方式 就 是 运行 Python3 应 用 。 在 终端 提示 符 后 (Mac/Unix/Linux) 键 
入 python3 ， 或 者 在 Windows 上 打开 Python3 应 用 。 ( 译 者 注 : Windows 上 设置 完 Python 
的 环境 变量 之 后 ， 就 可 以 在 cmd 或 PowerShell 中 执行 相同 操作 了 。 ) 

。 有 一 个 更 加 用 户 友好 的 应 用 叫做 ldle3 ( idle3 ) ， 可 用 于 学 习 这 门 语言 。|dle 会 高 亮 你 的 
代码 (叫做 语法 高 亮 ) ， 弹 出 使 用 提示 ， 并 且 标 记 一 些 错误 的 来 源 。ldle 总 是 由 Python 自 
带 ， 所 以 你 已 经 安装 它 了 。 

。 Emacs 编辑 器 可 以 在 它 的 某 个 缓冲 区 中 运行 交互 式 会 话 。 虽 然 它 学 习 起 来 有 些 挑战 ， 
Emacs 是 个 强大 且 多 功能 的 编辑 器 ， 适 用 于 任何 语言 。 请 阅读 61A 的 Emacs 教程 来 开始 。 
许多 程序 员 投 入 大 量 时 间 来 学 习 Emacs， 之 后 他 们 就 不 再 切换 编辑 器 了 。 


在 所 有 情况 中 ， 如 果 你 看 见 了 Python 提示 符 >>> ， 你 就 成 功 开 启 了 交互 式 会 话 。 这 些 讲义 使 
用 提示 符 来 展示 示例 ， 同 时 带 有 一 些 输入 。 


>>>2 2 


控制 : 每 个 会 话 都 保留 了 你 的 历史 输入 。 为 了 访问 这 些 历史 ， 需 要 按 下 <control>-P (上 一 
个 ) 和 <Control>-N (下 一 个 ) o。 <Control>-D 会 退出 会 话 ， 这 会 清除 所 有 历史 六 


大 大 

1.1.4 包 一 个 例子 
想像 会 把 不 知名 的 事物 用 一 种 形式 呈现 出 来 ， 诗 人 的 笔 再 使 它们 具有 如 实 的 形象 ， 空 庶 
的 无 物 也 会 有 了 居 处 和 名 字 。 
-威廉 .莎士比亚 ，《 件 夏 夜 之 梦 》 


为 了 介绍 Python， 我 们 会 从 一 个 使 用 多 个 语言 特性 的 例子 开始 。 下 一 节 中 ， 我 们 会 从 零 开 
始 ， 一 步 一 步 构 建 整个 语言 。 你 可 以 将 这 章 视 为 即将 到 来 的 特性 的 预览 。 


Python 拥 有 常见 编程 功能 的 内 建 支 持 ， 例 如 文本 操作 、 显 示 图 形 以 及 互联 网 通信 。 导 入 语句 


>>> from urllib.request import urlopen 


为 访问 互联 网 上 的 数据 加 载 功能 。 特 别 是 ， 它 提供 了 叫做 urlopen 的 函数 ， 可 以 访问 到 统一 
资源 定位 器 (URL) 处 的 内 容 ， 它 是 互联 网 上 的 某 个 位 置 。 


语句 和 表达 式 : Python 代码 包含 语句 和 表达 式 。 广 泛 地 说 ， 计 算 机 程序 包含 的 语 多 


1. 计算 茶 个 值 
2. 或 执行 茶 个 操作 


语句 通常 用 于 描述 操作 。 当 Python 解释 器 执行 语句 时 ， 它 执行 相应 操作 。 另 一 方面 ， 表 达 式 


通常 描述 产生 值 的 运算 。 当 Python 求解 表达 式 时 ， 就 会 计算 出 它 的 值 。 这 一 章 介绍 了 几 种 表 
达 式 和 语句 。 


赋值 语句 


>>> shakespeare = urlopen('http://inst.eecs.berkeley.edu/~cs61ia/fa1i1i/shakespeare.txt') 


将 名 称 shakespeare 和 后 面 的 表达 式 的 值 关联 起 来 9 这 个 表达 式 在 URL 上 调用 urlopen 函数 ， 
URL 包 含 了 莎士比亚 的 37 个 剧本 的 完整 文本 ， 在 单个 文本 文件 中 。 


函数 : 函数 封装 了 操作 数据 的 逻辑 。VWeb 地 址 是 一 块 数据 ， 莎 士 比 亚 的 剧本 文本 是 另 一 块 数 
据 。 前 者 产生 后 者 的 过 程 可 能 有 些 复杂 ， 但 是 我 们 可 以 只 通过 一 个 表达 式 来 调用 它们 ， 因 为 
复杂 性 都 塞 进 函数 里 了 。 函 数 是 这 一 章 的 主要 话题 。 


另 一 个 赋值 语句 


>>> words = set(shakespeare.read().decode().split()) 


将 名 称 words 关联 到 出 现在 莎士比亚 剧本 中 的 所 有 去 重 词汇 的 集合 ， 总 计 33,721 个 。 这 个 命 
令 链 调用 了 read 、 decode 和 split ， 每 个 都 操作 衔接 的 计算 实体 : 从 URL 读 取 的 数据 、 解 
码 为 文本 的 数据 、 以 及 分 割 为 单词 的 文本 。 所 有 这 些 单词 都 放 在 set 中 。 


对 象 : 集合 是 一 种 对 象 ， 它 支持 取 交 和 测试 成 员 的 操作 。 对 象 整合 了 数据 和 操作 数据 的 逻 
辑 ， 并 以 一 种 隐藏 其 复杂 性 的 方式 。 对 象 是 第 二 章 的 主要 话题 。 


表达 式 


>>> {w for w in words if len(w) >= 5 and w[::-1] in words} 
{'madam', 'stink', ‘'leets', 'rever', '"'drawer', 'stops', 'sessa', 
'repaid', 'speed', 'redder', 'devil', :minim ， 'sSpots', 'asses', 
"refer', 'lived', 'keels', 'diaper', 'sleek', 'steel', "1Leper' 
'level', 'deeps', 'repel', 'reward', "knits"} 


是 一 个 复合 表达 式 ， 求 出 正 序 或 倒序 出 现 的 “莎士比亚 词汇 集合。 神秘 的 记号 w[::-1] 遍历 单 
词 中 的 每 个 字符 ， 然 而 -1 表明 倒序 遍历 ( :: 表示 第 一 个 和 最 后 一 个 单词 都 使 用 默认 值 ) 。 
当 你 在 交互 式 会 话 中 输入 表达 式 时 ，Python 会 在 随后 打印 出 它 的 值 ， 就 像 上 面 那样 。 
解释 器 : 复合 表达 式 的 求解 需要 可 预测 的 过 程 来 精确 执行 解释 器 的 代码 。 执 行 这 个 过 程 ， 并 
求解 复合 表达 式 和 语句 的 程序 就 叫 解 释 器 。 解 释 器 的 设计 与 实现 是 第 三 章 的 主要 话题 。 


与 其 它 计算 机 程序 相 比 ， 编 程 语言 的 解释 器 通常 比较 独特 。Python 在 意图 上 并 没有 按照 莎 士 
比 亚 或 者 回 文 来 设计 ， 但 是 它 极 大 的 灵活 性 让 我 们 用 极 少 的 代码 处 理 大 量 文本 。 


后 ， 我 们 会 发 现 ， 所 有 这 些 核心 概念 都 是 紧密 相关 的 : 函数 是 对 象 ， 对 象 是 函数 ， 解 释 器 
二 者 的 实例 。 然 而 ， 对 这 些 概念 ， 以 及 它们 在 代码 组 织 中 的 作用 的 清晰 理解 ， 是 掌握 编程 


最 
是 
艺术 的 关键 。 


1.1.5 实践 指南 


Python 正 在 等 待 你 的 命令 。 你 应 当 探 索 这 门 语言 ， 即 使 你 可 能 不 知道 完整 的 词汇 和 结构 。 但 
是 ， 要 为 错误 做 好 准备 。 虽 然 计 算 机 极其 迅速 和 灵活 ， 它 们 也 十 分 十 板 。 在 斯 坦 福 的 导论 课 
中 ， 计 算 机 的 本 性 描述 为 


计算 机 的 基本 等 式 是 : 计算 机 = 强大 + 策 抽 


计算 机 非常 强大 ， 能 够 迅速 搜索 大 量 数 据 。 计 算 机 每 秒 可 以 执行 数 十 亿 次 操作 ， 其 中 每 
es 


计算 机 也 非常 策 抽 和 脆弱 。 它 们 所 做 的 操作 十 分 古板、 简单 和 和 机械化 。 计 算 机 缺少 任何 
类 似 丨 实 洞察 力 的 事情 ... 它 并 不 像 电影 中 的 HAL 9000。 如 果 不 出 意外 ， 你 不 应 被 计算 机 
吓 到 ， 就 像 它 拥有 某 神 兴 脑 一 梯 。 它 在 9 后 非常 机 械 化 。 


程序 是 一 个 人 使 用 他 的 莫 实 洞察 力 来 构建 出 的 一 些 实用 的 东西 ， 它 由 这 些 简单 的 小 操作 
所 组 成 。 


一 Francisco Cai & Nick Parlante, 斯 坦 福 CS101 


在 你 实验 Python 解 释 器 的 时 候 ， 你 会 马上 意识 到 计算 机 的 古板 : 即使 最 小 的 拼写 和 格式 修改 
都 会 导致 非 预期 的 输出 和 错误 。 


学 习 解 释 错误 和 诊断 非 预期 错误 的 原因 叫做 调试 (debugging) 。 它 的 一 些 指导 原则 是 


A 尽快 测 
试 你 写 好 的 任何 东西 来 及 早 捕获 错误 ， 并 且 从 你 的 组 件 中 获得 自 

2. 隔离 错误 : 复杂 程序 的 输出 、 表 达 式 、 或 语句 中 的 错误 ， 通 常 2 
块 。 当 尝试 诊断 问题 时 ， 在 你 能 够 尝试 修正 错误 之 前 ， 一 定 要 将 它 跟踪 到 最 小 的 代码 片 
段 。 

3. 检查 假设 : 解释 器 将 你 的 指令 执行 为 文字 -- 不 多 也 不 少 。 当 一 些 代码 不 匹配 程序 员 所 相 
信 的 (或 所 假设 的 ) 行为 ， 它 们 的 输出 就 会 是 非 预期 的 。 了 解 你 的 假设 ， 之 后 专注 于 验 
证 你 的 假设 是 否 整理 来 调试 。 

4. 询问 他 人 : 你 并 不 是 一 个 人 ! 如 果 你 不 理解 某 个 错误 信息 ， 可 以 询问 朋友 、 导 师 或 者 搜 
索引 擎 。 如 果 你 隔离 了 一 个 错误 ， 但 是 不 知道 如 何 改正 ， 可 以 让 其 它 人 来 看 一 看 。 在 小 
组 问题 解决 中 ， 会 分 享 一 大 堆 有 价值 的 编程 知识 。 


逐步 测试 、 模 块 化 设计 、 明 确 假设 和 团队 作业 是 贯穿 这 门 课 的 主题 。 但 愿 它们 也 能 够 一 直 伴 
随 你 的 计算 机 科学 生涯 。 


1.1 引言 
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1.2 编程 元 素 


来 源 : 1.2 The Elements of Programming 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


编程 语言 是 操作 计算 机 来 执行 任务 的 手段 ， 它 也 在 我 们 组 织 关 于 过 程 的 想法 中 ， 作 为 一 种 框 
架 。 程 序 用 于 在 编程 社 群 的 成 员 之 间 交 流 这 些 想法 。 所 以 ， 程 序 必 须 为 人 类 阅读 而 编写 ， 并 
且 仅 仅 碰 巧 可 以 让 机 器 执行 。 


当 我 们 描述 一 种 语言 时 ， 我 们 应 该 特别 注意 这 种 语言 的 手段 ， 来 将 简单 的 想法 组 合 为 更 复杂 
的 想法 。 每 个 强大 的 语言 都 拥有 用 于 完成 下 列 任务 的 机 制 : 


e@ 基本 的 表达 式 和 语句 ， 它 们 由 语言 提供 ， 表 示 最 简单 的 构建 代码 块 。 
e 组 合 的 手段 ， 复 杂 的 元 素 由 简单 的 元 素 通 过 它 来 构建 ， 以 及 
e。 抽象 的 手段 ， 复 杂 的 元 素 可 以 通过 它 来 命名 ， 以 及 作为 整体 来 操作 。 


在 编程 中 ， 我 们 处 理 两 种 元 素 : 函数 和 数据 。 (不 久之 后 我 们 就 会 探索 它们 并 不 是 真 的 非常 
不 同 。) 不 正式 地 说 ， 数 据 是 我 们 想 要 操作 的 东西 ， 函 数 描述 了 操作 数据 的 规则 。 所 以 ， 任 
何 强大 的 编程 语言 都 应 该 能 描述 基本 数据 和 基本 函数 ， 并 且 应 该 拥有 组 合 和 抽象 二 者 的 方 


1.2.1 表达 式 


在 实验 Python 解释 器 之 后 ， 我 们 现在 必须 重新 开始 ， 按 照 顺序 一 步 步 地 探索 Python 语言 。 
如 果 示 例 看 上 去 很 简单 ， 要 有 耐心 -- 更 刺激 的 东西 还 在 后 面 。 


我 们 以 基本 表达 式 作 为 开始 。 一 种 基本 表达 式 就 是 数值 。 更 精确 地 说 ， 是 你 键入 的 ， 由 10 进 
制 数字 表示 的 数值 组 成 的 表达 式 。 


>>> 42 
42 


表达 式 表 示 的 数值 也 许 会 和 算数 运算 符 组 合 ， 来 形成 复合 表达 式 ， 解 释 器 会 求 出 它 : 


>>> -1 - -1 

0 

>>>3 /2 bE /A /8 MUO EI/320 tt /4 1 2B 
OF9921875 


这 些 算 术 表 达 式 使 用 了 中 缀 符号 ， 其 中 运算 符 (例如 + 、- 、* 、/ ) 出 现在 操作 数 ( 数 
值 ) 中 间 。Python 包 含 许多 方法 来 形成 复合 表达 式 。 我 们 不 会 尝试 立即 将 它们 列举 出 来 ， 而 
是 在 进行 中 介绍 新 的 表达 式 形式 ， 以 及 它们 支持 的 语言 特性 。 


1.2.2 调用 表达 式 


最 重要 的 复合 表达 式 就 是 调用 表达 式 ， 它 在 一 些 参 数 上 调用 函数 。 回 忆 代 数 中 ， 郊 数 的 数学 
概念 是 一 些 输入 值 到 输出 值 的 映射 。 例 如 ， max 函数 将 它 的 输入 映射 到 单个 输出 ， 输 出 是 输 
入 中 的 最 大 值 。Python 中 的 函数 不 仅仅 是 输入 输出 的 映射 ， 它 表述 了 计算 过 程 。 但 是 ， 
Python 表示 骂 数 的 方式 和 数学 中 相同 。 


>>> max(7.5, 9.5) 
IS 


调用 表达 式 拥 有 子 表 达 式 : 运算 符 在 圆 括 号 之 前 ， 圆 括号 包含 去 号 分 隔 的 操作 数 。 运 算 符 必 
须 是 个 函数 ， 操 作 数 可 以 是 任何 值 。 这 里 它们 都 是 数值 。 当 求解 这 个 调用 表达 式 时 ， 我 们 
说 max 函数 以 参数 7.5 和 9.5 调用 ， 并 且 返 回 9.5。 


调用 表达 式 中 的 参数 的 顺序 极其 重要 。 例 如 ， 函 数 pow 计算 第 一 个 参数 的 第 二 个 参数 次 方 。 


>>> 和 2) 

10000 

>>> pow(2, 100) 
1267650600228229401496703205376 


函数 符号 比 中 缓 符 号 的 数学 惯例 有 很 多 优点 。 首 先 ， 函 数 可 以 接受 任何 数量 的 参数 : 


>>> max(1, -2, 3, -4) 
3 


不 会 产生 任何 歧义 ， 因 为 济 数 的 名 称 永远 在 参数 前 面 。 


其 次 ， 壕 数 符号 可 以 以 直接 的 方式 扩展 为 谋 套 表达 式 ， 其 中 元 素 本 身 是 复合 表达 式 。 在 话 套 
的 调用 表达 式 中 ， 不 像 谋 套 的 中 级 表达 式 ， 主 套 结 构 在 圆 括 号 中 非常 明显 。 


>>> max(min(1, -2), min(pow(3, 5), -4)) 
-2 
(理论 上 ) 这 种 谋 套 没有 任何 限制 ， 并 且 Python 解释 器 可 以 解释 任何 复杂 的 表达 式 。 然 而 ， 


人 们 可 能 会 被 多 级 谋 套 搞 坚 。 你 作为 程序 员 的 一 个 重要 作用 就 是 构造 你 自己 、 你 的 同伴 以 及 
其 它 在 未 来 可 能 会 阅读 你 代码 的 人 可 以 解释 的 表达 式 。 


最 后 ， 数 学 符号 在 形式 上 多 种 多 样 : 星 号 表示 乘法 ， 上 标 表示 乘 方 ， 横 杠 表示 除法 ， 
仙 壁 表示 开 方 。 这 些 符号 中 一 些 非常 难以 打出 来 。 但 是 ， 所 有 这 些 复杂 事物 可 以 通过 


达 式 的 符号 来 统一 。 虽 然 Python 通过 中 级 符号 (比如 + 和 - ) 支持 常见 的 数学 运算 
何 运 算 符 都 可 以 表示 为 带 有 名 字 的 函数 。 


1.2.3 导入 库 有 函数 


屋顶 和 
调用 表 
算 符 ， 任 


Python 定义 了 大 量 的 隐 数 ， 和 包括 上 一 节 提 到 的 运算 符 函 数 ， 但 是 通常 不 能 使 用 它们 的 名 字 ， 
这 样 做 是 为 了 避免 混乱 。 反 之 ， 它 将 已 知 的 函数 和 其 它 东 西 组 织 在 模块 中 ， 这 些 模块 组 成 了 
Python 库 。 需 要 导入 它们 来 使 用 这 些 元 素 。 例 如 ， math 模块 提供 了 大 量 的 常用 数学 函数 : 


>>> from math import sqrt, exp 
>>> sqrt(256) 

6 

>>> exp(1) 

2.718281828459045 


operator 模块 提供 了 中 缓 运算 符 对 应 的 函数 : 


>>> from operator import add, sub, mul 
>>> add(14, 28) 

42 

>>> sub(100, mul(7, add(8, 4))) 

16 


import 语句 标明 了 模块 名 称 (例如 operator 或 math ) ， 之 后 列 出 被 导入 模块 的 具名 属性 


(例如 sqrt 和 exp ) 。 


Python 3 库 文 档 列 出 了 定义 在 每 个 模块 中 的 函数 ， 例 如 数学 模块 。 然 而 ， 这 个 文档 为 了 解 整 
个 语言 的 开发 者 编写 。 到 现在 为 止 ， 你 可 能 发 现 使 用 函数 做 实验 会 比 阅读 文档 告诉 你 更 多 它 
的 行为 。 当 你 更 熟悉 Python 语言 和 词汇 时 ， 这 个 文档 就 变 成 了 一 份 有 价值 的 参考 来 源 。 


1.2.4 名 称 和 环境 


编程 语言 的 要 素 之 一 是 它 提供 的 手段 ， 用 于 使 用 名 称 来 引用 计 草 对 象 。 如 果 一 个 值 被 给 予 了 


名 称 ， 我 们 就 说 这 个 名 称 绑 定 到 了 值 上 面 。 


在 Python 中 ， 我 们 可 以 使 用 赋值 语句 来 建立 新 的 绑 定 ， 它 包含 = 左边 的 名 称 和 右边 


>>> radius = 10 
>>> radius 

10 

>>> 2 * radius 
20 


名 称 也 可 以 通过 import 语 名 绑 定 : 


的 值 。 


>>> from math import pi 
>>>=p13 “71 /223 
1.0002380197528042 


我 们 也 可 以 在 一 个 语句 中 将 多 个 值 赋 给 多 个 名 称 ， 其 中 名 称 和 表达 式 由 过 号 分 隔 : 


下 


>>> area, circumference = pi * radius * radius, 2 * pi * radius 


>>> area 

S14.15926535897983 
>>> circumference 
62 .83185307179586 


= 符号 在 Python (以 及 许多 其 它 语言 ) 中 叫做 赋值 运算 符 。 赋 值 是 Python 中 的 最 简单 的 抽 
象 手段 ， 因 为 它 使 我 们 可 以 使 用 最 简单 的 名 称 来 引用 复合 操作 的 结果 ， 例 如 上 面 计 算 
的 area ° 这 样 2? 复杂 的 程序 可 以 由 复杂 性 递增 的 计算 对 象 一 步 一 步 构建 2 


将 名 称 绑 定 到 值 上 ， 以 及 随后 通过 名 称 来 检索 这 些 值 的 可 能 ， 意 味 着 解释 器 必须 维护 茶 种 内 
存 来 跟踪 这 些 名 称 和 值 的 人 这 些 内 存 叫 做 环境 。 


名 称 也 可 以 绑 定 到 函数 。 例 如 ， 名 称 max 绑 定 到 了 我 们 曾经 用 过 的 max 有 函数 上 。 函 数 不 像 数 
值 ， 不 易于 泻 业 成 文本 ， 所 以 Python 使 用 识别 描述 来 代替 ， 当 我 们 打印 函数 时 : 


>>> max 
<built-in function max> 


我 们 可 以 使 用 赋值 运算 符 来 给 现 有 函数 起 新 的 名 字 : 


>>> f = max 


二 之 > 二 让 

<built-in function max> 
>>> f(3, 4) 

4 


成 功 的 赋值 语 猛 可 以 将 名 称 绑 定 到 新 的 值 : 


二 之 之 是 三 证 性 
>>> 
之 


在 Python 中 ， 通 过 赋值 绑 定 的 名 称 通常 叫做 变量 名 称 ， 因 为 它们 在 执行 程序 期 间 可 以 绑 定 到 
许多 不 同 的 值 上 面 。 


1.2.5 诅 套 表达 式 的 求解 


我 们 这 章 的 目标 之 一 是 隔离 程序 化 思考 相关 的 问题 。 作 为 一 个 例子 ， 考 虑 嵌 套 表达 式 的 求 
解 ， 解 释 器 自己 会 遵循 一 个 过 程 : 


为 了 求 出 调用 表达 式 ，Python 会 执行 下 列 事情 : 


。 求 出 运算 符 和 操作 数 子 表达 式 ， 之 后 
。 在 值 为 操作 数 子 表达 式 的 参数 上 调用 值 为 运算 符 子 表达 式 的 函数 。 


这 个 简单 的 过 程 大 体 上 展示 了 一 些 过 程 上 的 重点 。 第 一 步 表 明 为 了 完成 调用 表达 式 的 求 值 过 
程 ， 我 们 首先 必须 求 出 其 它 表 达 式 。 所 以 ， 求 值 过 程 本 质 上 是 递归 的 ， 也 就 是 说 ， 它 会 调用 
其 自身 作为 步骤 之 一 。 


例如 ， 求 出 


>>> mul(add(2, mul(4, 6)), add(3, 5)) 
208 


需要 应 用 四 次 求 值 过 程 。 如 果 我 们 将 每 个 需要 求解 的 表达 式 抽出 来 ， 我 们 可 以 可 视 化 这 
程 的 层次 结构 : 


208 
mul(add(2, mul(4, 6)), add(3, 5)) 
1 


和 


add(2, mul(4, 6)) 
Fa + 





ml] [C4] [6 


个 示例 叫做 表达 式 树 。 在 计算 机 科学 中 ， 树 从 顶端 向 下 生长 。 每 一 点 上 的 对 象 叫 做 节点 
里 它们 是 表达 式 和 它们 的 值 。 


求 出 根 节点 ， 也 就 是 整个 表达 式 ， 需 要 首先 求 出 枝 干 节点 ， 也 就 是 子 表达 式 。 叶 子 节点 (也 
就 是 没有 子 节点 的 节点 ) 的 表达 式 表 示 函 数 或 数值 。 内 部 节点 分 为 两 部 分 : 表示 我 们 想 要 应 
用 的 求 值 规则 的 调用 表达 式 ， 以 及 表达 式 的 结果 。 观 察 这 棵 树 中 的 求 值 ， 我 们 可 以 想象 操作 
数 的 值 向 上 流动 ， 从 叶子 节点 开始 ， 在 更 高 的 层 上 融合 。 


接 下 来 ， 观 察 第 一 步 的 重复 应 用 ， 这 会 将 我 们 带 到 需要 求 值 的 地 方 ， 并 不 是 调用 表达 式 ， 而 
是 基本 表达 式 ， 例 如 数字 (比如 2 ) ， 以 及 名 称 (比如 add ) ， 我 们 需要 规定 下 列 事物 来 谨 
惯 对 待 基 本 的 东西 : 


e 数字 求 值 为 它 标明 的 数值 ， 
。 名 称 求 值 为 当前 环境 中 这 个 名 称 所 关联 的 值 


要 注意 环境 的 关键 作用 是 决定 表达 式 中 符号 的 含义 。Python 中 ， 在 不 指定 任何 环境 信息 ， 来 
提供 名 称 x (以 及 名 称 add ) 的 含义 的 情况 下 ， 谈 到 这 样 一 个 表达 式 的 值 没 有 意义 


>>> add(x, 1) 


环境 提供 了 求 值 所 发 生 的 上 下 文 ， 它 在 我 们 理解 程序 执行 中 起 到 重要 作用 。 


这 个 求 值 过 程 并 不 符合 所 有 Python 代码 的 求解 ， 仅 仅 是 调用 表达 式 、 数 字 和 名 称 。 例 如 ， 它 
并 不 能 处 理 赋值 语句。 


>>>>090 -9 


的 执行 并 不 返回 任何 值 ， 也 不 求解 任何 参数 上 的 函数 ， 因 为 赋值 的 目的 是 将 一 个 名 称 绑 定 到 
一 个 值 上 。 通 常 ， 语 句 不 会 被 求 值 ， 而 是 被 执行 ， 它 们 不 产生 值 ， 但 是 会 改变 一 些 东 西 。 每 
种 语句 或 表达 式 都 有 自己 的 求 值 或 执行 过 程 ， 我 们 会 在 涉及 时 逐步 介绍 。 


注 : 当 我 们 说 “数字 求 值 为 数值 "的 时 候 ， 我 们 的 实际 意思 是 Python 解释 器 将 数字 求解 为 数 
值 。Python 的 解释 器 使 编程 语言 具有 了 这 个 意义 。 假 设 解释 器 是 一 个 固定 的 程序 ， 行 为 总 是 
一 致 ， 我 们 就 可 以 说 数字 (以 及 表达 式 ) 自己 在 Python 程序 的 上 下 文中 会 求解 为 值 。 


1.2.6 函数 图 解 


当 我 们 继续 构建 来 值 的 形式 模型 时 ， 我 们 会 发 现 解释 器 内 部 状态 的 图 解 有 助 于 我 们 跟踪 求 值 
过 程 的 发 展 。 这 些 图 解 的 必要 部 分 是 函数 的 表示 。 


纯 函 数 : 具有 一 些 输 入 (参数) 以 及 返回 一 些 输 出 (调用 结果 ) 的 函数 。 内 建 函 数 


>>> abs(-2) 
之 


可 以 描述 为 接受 输入 并 产生 输出 的 小 型 机 器 。 


-2 j> abs(number) :| 
| p>2 
abs 是 纯 函 数 。 纯 函数 具有 一 个 特性 ， 调 用 它们 时 除了 返回 一 个 值 之 外 没有 其 它 效 果 。 


非 纯 函数 : 0 ， 调 用 非 纯 函数 会 产生 副作用 ， 这 会 改变 解释 器 或 计算 机 的 
一 些 状 态 。 一 遍 的 副作用 就 是 在 返回 值 之 外 生成 额外 的 输出 ， 例 如 使 用 print 函数 : 


>>> print(-2) 
党 


>>> print(1, 2, 3) 
1 203 


虽然 这 些 例子 中 的 print 和 abs 看 起 来 很 像 ， 但 它们 本 质 上 以 不 同方 式 工作 。 print 的 返回 
值 永远 是 None ， 它 是 一 个 Python 特殊 值 ， 表 示 没 有 任何 东西 。Python 交互 式 解释 器 并 不 会 
自动 打印 None 值 。 这 里 ， print 自己 打印 了 输出 ， 作 为 调用 中 的 副作用 。 


大 区 
| Pp None 
人 一 
display “-2” 
调用 print 的 谋 套 表达 式 会 廿 显 出 它 的 非 纯 特 性 : 


>>> print(print(1), print(2)) 
1 


2 
None None 


如 果 你 发 现 自己 不 能 预料 到 这 个 输出 ， 画 出 表达 式 树 来 弄 清 为 什么 这 个 表达 式 的 求 值 会 产生 
奇怪 的 输出 。 


要 当心 print ! 它 的 返回 值 为 None ， 意 味 着 它 不 应 该 在 赋值 语句 中 用 作 表 达 式 : 


>>> two = print(2) 


>>> print(two) 
None 


签名 : 不 同 函 数 具 有 不 同 的 允许 接受 的 参数 数量 。 为 了 跟踪 这 些 必 备 条 件 ， 我 们 需要 以 一 种 
展示 函数 名 称 和 参数 名 称 的 方式 ， 画 出 每 个 函数 。 abs 函数 值 接受 一 个 叫 作 number 的 参数 ， 
向 它 提供 更 多 或 更 少 的 参数 会 产生 错误 。 print 函数 可 以 接受 任意 数量 的 参数 ， 所 以 它 泻 染 
为 print(...) 。 遂 数 的 可 接受 参数 的 描述 叫做 函数 的 签名 。 


1.3 定义 新 的 函数 


来 源 : 1.3 Defining New Functions 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 
我 们 已 经 在 Python 中 认识 了 一 些 在 任何 强大 的 编程 语言 中 都 会 出 现 的 元 素 : 
1. 数值 是 内 建 数据 ， 算 数 运算 是 函数 。 
2. 谋 套 函数 提供 了 组 合 操 作 的 手段 。 
3. 名 称 到 值 的 绑 定 提供 了 有 限 的 抽象 手段 。 


现在 我 们 将 要 了 解 函 数 定义 ， 一 个 更 加 强大 的 抽象 技巧 ， 名 称 通过 它 可 以 绑 定 到 复合 操作 
上 ， 并 可 以 作为 一 个 单元 来 引用 。 


我 们 通过 如 何 表达 “平方 "这 个 概念 来 开始 。 我 们 可 能 会 说 ，“ 对 一 个 数 求 平方 就 是 将 这 个 数 乘 
上 它 自己 ”。 在 Python 中 就 是 : 


>>> def square(x): 
return mul(x, x) 


这 定义 了 一 个 新 的 函数 ， 并 赋予 了 名 称 square 。 这 个 用 户 定义 的 函数 并 不 内 建 于 解释 器 。 它 
| 己 的 复合 操作 。 定 义 中 的 x 叫做 形式 参数 ， 它 为 被 乘 的 东西 提供 一 个 名 
称 。 这 个 定义 创建 了 用 户 定义 的 函数 ， 并 且 将 它 关 联 到 名 称 square 上 。 


函数 定义 包含 def 语句 ， 它 标明 了 <name> (名 称 ) 和 一 列 带 有 名 字 

的 <formal parameters> ( 形 式 参 数 ) 。 之 后 ，return (返回 ) 语句 叫做 函数 体 ， 指 定 了 遂 
数 的 <return expression> (返回 表达 式 ) 它 是 函数 无 论 什么 时 候 调 用 都 需要 求 值 的 表达 
式 。 


def <name>(<formal parameters>): 
return <return expression> 


第 二 行 必 须 缩 进 ! 按照 惯例 我 们 应 该 缩 进 四 个 空格 ， 而 不 是 一 个 Tab， 返 回 表 达 式 并 不 是 立即 
求 值 ， 它 储存 为 新 定义 函数 的 一 部 分 ， 并 且 只 在 函数 最 终 调用 时 会 被 求 出 。【〈 很 快 我 们 就 会 
看 到 缩 进 区 域 可 以 跨越 多 行 。) 


定义 了 square 之 后 ， 我 们 使 用 调用 表达 式 来 调用 它 : 


>>> square(21) 

441 

>>> square(add(2, 5)) 
49 

>>> square(square(3)) 
8 


我 们 也 可 以 在 构建 其 它 函 数 时 ， 将 square 用 作 构 建 块 。 列 入 ， 我 们 可 以 轻易 定 
义 sum_squares 函数 ， 它 接受 两 个 数值 作为 参数 ， 并 返回 它们 的 平方 和 : 


>>> def sum_ squares(x, y): 

return add(square(x), square(y)) 
>>> sum_squares(3, 4) 
和 25 


用 户 定 义 的 函数 和 内 建 函 数 以 同 种 方法 使 用 。 确 实 ， 我 们 不 可 能 在 sum_squares 的 定义 中 分 辨 
出 square 是 否 构 建 于 解释 器 中 ， 从 模块 导入 还 是 由 用 户 定义 。 


1.3.1 环境 


我 们 的 Python 子 集 已 经 足够 复杂 了 “， 但 程序 的 含义 还 不 是 非常 明显 。 如 果 形 式 参数 和 内 建 函 
数 具有 相同 名 称 会 如 何 呢 ? 两 个 函数 是 否 能 共享 名 称 而 不 会 产生 混乱 呢 ? 为 了 解决 这 些 疑 
问 ， 我 们 必须 详细 描述 环境 。 


表达 式 求 值 所 在 的 环境 由 帧 的 序列 组 成 ， 它 们 可 以 表述 为 一 些 念 子 。 每 一 帧 都 包含 了 一 些 绑 
定 ， 它 们 将 名 称 和 对 应 的 值 关 联 起 来 。 全 局 帧 只 有 一 个 ， 它 包含 所 有 内 建 函 数 的 名 称 绑 定 
(只 展示 了 abs 和 max ) 。 我 们 使 用 地 球 符 号 来 表示 全 局 。 


mmax(a，b，C， vam 


ss 





赋值 和 导入 语句 会 向 当前 环境 的 第 一 个 帧 添加 条 目 。 到 目前 为 止 ， 我 们 的 环境 只 包含 全 局 
幅 。 


>>> from math import pi 
>>> tau = 2 * pi 


max(a，b，C， | 


ER 
4 


6.28... 





def 语句 也 将 绑 定 绑 定 到 由 定义 创建 的 函数 上 上。 定义 square 之 后 的 环境 如 图 所 示 : 


square: 





square (x): | 
| return x* X 


这 些 环境 图 示 展 示 了 当前 环境 中 的 绑 定 ， 以 及 它们 所 绑 定 的 值 (并 不 是 任何 帧 的 一 部 分 ) 。 
要 注意 函数 名 称 是 重复 的 ， 一 个 在 帧 中 ， 另 一 个 是 函数 的 一 部 分 。 这 一 重复 是 有 意 的 ， 许 多 
不 同 的 名 字 可 能 会 引用 相同 函数 ， 但 是 函数 本 身 只 有 一 个 内 在 名 称 。 但 是 ， 在 环境 中 由 名 称 
检索 值 只 检查 名 称 绑 定 。 函 数 的 内 在 名 称 不 在 名 称 检索 中 起 作用 。 在 我 们 之 前 看 到 的 例子 
中 : 


>>> f = max 
>>> TT 
<built-in function max> 


名 称 max 是 函数 的 内 在 名 称 ， 以 及 打印 f 时 我 们 看 到 的 名 称 。 此 外 ， 名 称 max 和 fF 在 全 局 
环境 中 都 绑 定 到 了 相同 函数 上 。 


在 我 们 介绍 Python 的 附加 特性 时 ， 我 们 需要 扩展 这 些 图 示 。 每 次 我 们 这 样 做 的 时 候 ， 我 们 都 
会 列 出 图 示 可 以 表达 的 新 特性 。 


新 的 环境 特性 : 赋值 和 用 户 定义 的 函数 定义 。 


1.3.2 调用 用 户 定 义 的 郊 数 


为 了 求 出 运算 符 为 用 户 定义 函数 的 调用 表达 式 ，Python 解释 器 遵循 与 求 出 运算 符 为 内 建 函数 
的 表达 式 相似 的 过 程 。 也 就 是 说 ， 解 释 器 求 出 操作 数 表 达 式 ， 并 且 对 产生 的 实 参 调用 具名 函 
数 。 


调用 用 户 定义 的 函数 的 行为 引入 了 第 二 个 局 部 帧 ， 它 只 能 由 函数 来 访问 。 为 了 对 一 些 实 参 调 
用 用 户 定义 的 函数 : 

1 在 新 的 局 部 帧 中 ， 将 实 参 绑 定 到 函数 的 形式 参数 上 。 

2， 在 当前 帧 的 开头 以 及 全 局 帧 的 末尾 求 出 函数 体 。 


ww 包含 参数 绑 定 ， 之 后 是 全 局 帧 ， 包 
它 所 有 东西 。 每 个 函数 示例 都 有 自己 的 独立 局 部 帧 。 





abs (x): 
square: 一 上 = 
: square(x): 
| : | Perturn 光 米 六 
Xs: 一 2 
square A 





6 
def square(x): 


return X 米 X 
b> square(-2) 


这 张 图 包含 两 个 不 同 的 Python 解释 器 层面 : 当前 的 环境 ， 以 及 表达 式 树 的 一 部 分 ， 它 和 要 求 
值 的 代码 的 当前 一 行 相关 。 我 们 描述 了 调用 表达 式 的 求 值 ， 用 户 定义 的 函数 ( 蓝 色 ) 表示 为 
两 部 分 的 圆 角 矩 形 。 点 线 箭头 表示 哪个 环境 用 于 在 每 个 部 分 求解 表达 式 。 


。 上 半 部 分 展示 了 调用 表达 式 的 求 值 。 这 个 调用 表达 式 并 不 在 任何 函数 里 面 ， 所 以 他 在 全 
局 环境 中 求 值 。 所 以 ， 任 何 里 面 的 名 称 (例如 square ) 都 会 在 全 局 帧 中 检索 。 

e 下 半 部 分 展示 了 square 函数 的 函数 体 。 它 的 返回 表达 式 在 上 面 的 步骤 1 引入 的 新 环境 中 
求 值 ， 它 将 square 的 形式 参数 x 的 名 称 绑 定 到 实 参 的 值 -2 上 。 


环境 中 帧 的 顺序 会 影响 由 表达 式 中 的 名 称 检索 返回 的 值 。 我 们 之 前 说 名 称 求解 为 当前 环境 中 
与 这 个 名 称 关联 的 值 。 我 们 现在 可 以 更 精确 一 些 : 


e。 名 称 求解 为 当前 环境 中 ， 最 先 发 现 该 名 称 的 帧 中 ， 绑 定 到 这 个 名 称 的 值 。 


我 们 关于 环境 、 名 称 和 函数 的 概念 框架 建立 了 求 值 模型 ， 虽 然 一 些 机 制 的 细节 仍旧 没有 指明 
(例如 绑 定 如 何 实现 ) ， 我 们 的 模型 在 描述 解释 器 如 何 求解 调用 表示 上 ， 变 得 更 准确 和 正 
确 。 在 第 三 章 我 们 会 看 到 这 一 模型 如 何 用 作 一 个 蓝图 来 实现 编程 语言 的 可 工作 的 解释 器 。 


新 的 环境 特性 : 函数 调用 。 


下 


1.3.3 示例 : 调用 用 户 定义 的 函数 


让 我 们 再 一 次 考虑 两 个 简单 的 定义 : 


>>> from operator import add, mul 
>>> def square(x): 
return mul(x, x) 
>>> def sum squares(x, y): 
return add(square(x), square(y)) 







square: 


sum_squares: square(x): 


| return mul(x, x) 
sum_squares(x, y): ] 


return add(square(x), square(y)) 
以 及 求解 下 列 调用 表达 式 的 过 程 : 


>>> sum_squares(5, 12) 
169 


Python 首先 会 求 出 名 称 sum_squares ， 它 在 全 局 帧 绑 定 了 用 户 定义 的 函数 。 基 本 的 数字 表达 
式 5 和 12 求 值 为 它们 所 表达 的 数值 。 


之 后 ，Python 调用 了 sum_squares ， 它 引入 了 局 部 帧 ， 将 x 绑 定 为 5， 将 y 绑 定 为 12。 








square: 


sum_squares: square (x): 


| return mul(x, x) 


sum_squares(x, y): 


return add(square(x), square(y)) 





sum_squares(5,12) 


be e)add(square(x),square(y) ) 


def square(x): 
return mul(x,x) 
def sum_squares(x,y): 
return add(...) 
BP> sum_squares(5, 12) 


这 张 图 中 ， 局 部 帧 指向 它 的 后 继 ， 全 局 帧 。 所 有 局 部 帧 必须 指向 某 个 先导 ， 这 些 链接 定义 了 
当前 环境 中 的 帧 序列 。 


sum_square 的 函数 体 包 含 下 列 调用 表达 式 : 


add ( Ssquare(x) , Ssquare(y) ) 


"operator" "operand 0" "operand 1" 


全 部 三 个 子 表达 式 在 当前 环境 中 求 值 ， 它 开始 于 标记 为 sum_squares 的 帧 。 运 算 符 字 表 达 

式 add 是 全 局 帧 中 发 现 的 名 称 ， 绑 定 到 了 内 建 的 加 法 函数 上 。 两 个 操作 数 子 表达 式 必 须 在 加 
法 函数 调用 之 前 依次 求 值 。 两 个 操作 数 都 在 当前 环境 中 求 值 ， 开 始 于 标记 为 sum_squares 的 
帧 。 在 下 面 的 环境 图 示 中 ， 我 们 把 这 一 帧 叫做 A ， 并 且 将 指向 这 一 帧 的 箭头 同时 替换 为 标 
签 A。 


在 使 用 这 个 局 部 帧 的 情况 下 ， 函 数 体 表达 式 mul(x，x) 求 值 为 25。 


我 们 的 求 值 过 程 现 在 轮 到 了 操作 数 1，y 的 值 为 12。Python 再 次 求 出 square 的 函数 体 。 这 
次 引入 了 另 一 个 局 部 环境 帧 ， 将 x 绑 定 为 12。 所 以 ， 操 作 数 1 求 值 为 144。 







square: 





sum_squares: squarel(x): 
add, mul, 


| return mul(x, x) 
je 5 : : sum_squares(x, y): | 


V12 : return add(square(x), square(y)) 


sum_squares 









A 






XE 2 sum_squares(5, 12) 
A Square 
Aiadd(square(x),square(y ) ) 
一 和 一 一 一 一 
> 
PE A def square(x): 


return mul(x,x) 

def sum_squares(x,y): 
return add(...) 
BP> sum_squares(5, 12) 






square(y) 


le Mul lx. Ky 





PE 


最 后 ， 对 实 参 25 和 144 调用 加 法 会 产生 sum_squares 函数 体 的 最 终 值 : 169。 


这 张 图 虽然 复杂 ， 但 是 用 于 展示 我 们 目前 为 止 发 展 出 的 许多 基础 概念 。 名 称 绑 定 到 值 上 面 ， 
它 延 伸 到 许多 局 部 帧 中 ， 局 部 帧 在 唯一 的 全 局 帧 之 上 ， 全 局 帧 包含 共享 名 称 。 表 达 式 为 树 形 
结构 ， 以 及 每 次 子 表 达 式 包含 用 户 定义 函数 的 调用 时 ， 环 境 必 须 被 扩展 。 


所 有 这 些 机 制 的 存在 确保 了 名 称 在 表达 式 中 正确 的 地 方 解 析 为 正确 的 值 。 这 个 例子 展示 了 为 
什么 我 们 的 模型 需要 所 引入 的 复杂 性 。 所 有 三 个 局 部 帧 都 包含 名 称 x 的 绑 定 。 但 是 这 个 名 称 
在 不 同 的 帧 中 绑 定 到 了 不 同 的 值 上 。 局 部 帧 分 离 了 这 些 名 称 。 


1.3.4 局 部 名 称 


函数 实现 的 细节 之 一 是 实现 者 对 形式 参数 名 称 的 选 应 影响 函数 行为 。 所 以 ， 下 面 的 函数 
应 具有 相同 的 行为 : 


>>> def square(Xx): 
return mul(x, x) 

>>> def squarel(y): 
return mul(y, y) 


0 则 -- 也 就 是 函数 应 不 依赖 于 编写 者 选择 的 参数 名 称 -- 对 编程 语言 来 说 具有 重要 的 结 
。 最 简单 的 结果 就 是 函数 参数 名 称 应 保留 在 函数 体 的 局 部 范围 中 。 


如 果 参 数 不 位 于 相应 函数 的 局 部 范围 中 ， square 的 参数 x 可 能 和 sum_squares 中 的 参 
数 x 产生 混乱 。 严 格 来 说 ， 这 并 不 是 问题 所 在 : 不 同 局 部 帧 中 的 x 的 绑 定 是 不 相关 的 。 我 们 
的 计算 模型 具有 严谨 的 设计 来 确保 这 种 独立 性 。 


我 们 说 局 部 名 称 的 作用 域 被 限制 在 定义 它 的 用 户 定义 函数 的 函数 体 中 。 当 一 个 名 称 不 能 再 被 
访问 时 ， 它 就 离开 了 作用 域 。 作 用 域 的 行为 并 不 是 我 们 模型 的 新 事实 ， 它 是 环境 的 工作 方式 
的 结果 。 


1.3.5 实践 指南 : 选择 名 称 


可 修改 的 名 称 并 不 代表 形式 参数 的 名 称 完全 不 重要 。 反 之 ， 选 择 良好 的 函数 和 参数 名 称 对 于 
函数 定义 的 人 类 可 解释 性 是 必要 的 。 


下 面 的 准则 派生 于 Python 的 代码 风格 指南 ， 可 被 所 有 【( 非 反叛 ) Python 程序 员 作为 指南 。 
一 些 共享 的 约定 会 使 社区 成 员 之 间 的 沟通 变 得 容易 。 遵 循 这 些 约定 有 一 些 副作用 ， 我 会 发 现 
你 的 代码 在 内 部 变 得 一 致 。 


1， 函数 名 称 应 该 小 写 ， 以 下 划 线 分 隔 。 提 倡 描述 性 的 名 称 。 

2.， 函数 名 称 通常 反映 解释 器 向 参数 应 用 的 操作 (例如 print 、 add 、 square ) ， 或 者 结 
果 (例如 max 、 abs 、) sum ) 9 

3. 参数 名 称 应 小 写 ， 以 下 划 线 分 隔 。 提 倡 单个 词 的 名 称 。 

4. 参数 名 称 应 该 反映 参数 在 函数 中 的 作用 ， 并 不 仅仅 是 满足 的 值 的 类 型 。 

5， 当 作用 非常 明确 时 ， 单 个 字母 的 参数 名 称 可 以 接受 ， 但 是 永远 不 要 使 用 1 (小 写 的 |L ) 
和 0 (大 写 的 o) ， 或 者 I (大 写 的 i ) 来 避免 和 数字 混淆 。 


周期 性 对 你 编写 的 程序 复查 这 些 准则 ， 不 用 多 久 你 的 名 称 会 变 得 十 分 Python 化 。 


1.3.6 作为 抽 因 的 函数 


虽然 sum_squares 十 分 简单 ， 但 是 它 演 示 了 用 户 定义 函数 的 最 强大 的 特性 ° sum_squares 函数 
使 用 square 函数 定义 ， 但 是 仅仅 依赖 于 square 定义 在 输入 参数 和 输出 值 之 间 的 关系 。 


我 们 可 以 编写 sum_squares ， 而 不 用 考虑 如 何 计算 一 个 数值 的 平方 。 平 方 计算 的 细节 被 隐藏 
了 ， 并 可 以 在 之 后 考虑 人 确实 在 sum_squares 看 来 ” square 并 不 是 一 个 特定 的 函数 体 ， 而 
是 茶 个 函数 的 抽象 ， 也 就 是 所 谓 的 函数 式 抽 象 。 在 这 个 层级 的 抽象 中 ， 任 何 能 计算 平方 的 函 
数 都 是 等 价 的 。 


所 以 ， 仅 仅 考 虑 返回 值 的 情况 下 ， 下 面 两 个 计算 平方 的 函数 是 难以 区 分 的 。 每 个 都 接受 数值 
参数 并 且 产 生 那 个 数 的 平方 作为 返回 值 。 


>>> def square(x): 
return mul(x, x) 
>>> def square(x): 
return mul(x, x-1) + x 


换 甸 话说 ， 函 数 定 义 应 该 能 够 隐藏 细节 。 函 数 的 用 户 可 能 不 能 自己 编写 函数 ， 但 是 可 以 从 其 
它 程 序 员 那里 获得 它 作为 “ 黑 盒 "。 用 户 不 应 该 需要 知道 如 何 实现 来 调用 。Python 库 拥 有 这 个 
特性 。 许 多 开发 者 使 用 在 这 里 定义 的 函数 ， 但 是 很 少 有 人 看 过 它们 的 实现 。 实 际 上 ， 许 多 
Python 库 的 实现 并 不 完全 用 Python 编写 ， 而 是 C 语言 。 


1.3.7 运算 符 


算术 运算 符 (例如 + 和 - ) 在 我 们 的 第 一 个 例子 中 提供 了 组 合 手段 。 但 是 我 们 还 需要 为 包含 
这 些 运算 符 的 表达 式 定义 求 值 过 程 。 


每 个 带 有 中 缓 运算 符 的 Python 表达 式 都 有 自己 的 求 值 过 程 ， 但 是 你 通常 可 以 认为 他 们 是 调用 
表达 式 的 快捷 方式 。 当 你 看 到 


>>>>720b 3 


的 时 候 ， 可 以 简单 认为 它 是 


>>> add(2，3) 
5 


的 快捷 方式 。 


级 记号 可 以 寿 套 ， 就 像 调 用 表达 式 那 样 。Python 运算 符 优先 级 中 采用 了 常规 的 数学 规则 ， 
它 指导 了 如 何 解 释 带 有 多 种 运算 符 的 复合 表达 式 。 


>>>22 F315 
19 


和 下 面 的 表达 式 的 求 值 结果 相同 


>>> add(add(2, mul(3, 4)) ，5) 
19 


调用 表达 式 的 谋 套 比 运算 符 版 本 更 加 明显 。Python 也 允许 括号 括 起 来 的 子 表达 式 ， 来 和 覆盖 通 
常 的 优先 级 规则 ， 或 者 使 表达 式 的 吝 套 结构 更 加 明显 : 


>>>°(20503)9 (405 
45 


和 下 面 的 表达 式 的 求 值 结果 相同 


>>> mul(add(2, 3), add(4, 5)) 
45 


你 应 该 在 你 的 程序 中 自由 使 用 这 些 运算 符 和 括号 。 对 于 简单 的 算术 运算 ，Python 在 惯例 上 代 
向 于 运算 符 而 不 是 调用 表达 式 。 


实践 指南 : 函数 的 艺术 


来 源 : 1.4 Practical Guidance: The Art of the Function 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


函数 是 所 有 程序 的 要 素 ， 无 论 规模 大 小 ， 并 且 在 编程 语言 中 作为 我 们 表达 计算 过 程 的 主要 媒 
介 。 目 前 为 止 ， 我 们 讨论 了 函数 的 形式 特性 ， 以 及 它们 如 何 使 用 。 我 们 现在 跳 转 到 如 何 编写 
良好 的 函数 这 一 话题 。 


。 每 个 函数 都 应 该 只 做 一 个 任务 。 这 个 任务 可 以 使 用 短小 的 名 称 来 定义 ， 使 用 一 行文 本 来 
标识 。 顺 序 执行 多 个 任务 的 函数 应 该 拆 分 在 多 个 函数 中 。 

e。 不 要 重复 劳动 (DRY) 是 软件 工程 的 中 心 法 则 。 所 谓 的 DRY 原 则 规定 多 个 代码 段 不 应 该 
首 述 重复 的 逻辑 。 反 之 ， 逻 辑 应 该 只 实现 一 次 ， 指 定 一 个 名 称 ， 并 且 多 次 使 用 。 如 果 你 
发 现 自己 在 复制 粘贴 一 段 代 码 ， 你 可 能 发 现 了 一 个 使 用 函数 抽象 的 机 会 。 

a 因为 它 是 pow 函数 的 
一 个 特例 ， 这 个 函数 计算 任何 数 的 任何 次 方 。 


这 些 准则 提升 代码 的 可 读 性 ， 减 少 错误 数量 ， 并 且 通 党 使 编写 的 代码 总 数 最 小 。 将 复杂 的 任 
0 简洁 的 2 ， 它 需要 一 些 经 验 来 掌握 。 幸 运 的 是 ，Python 提供 了 一 些 特 
隆 来 支持 你 的 努 


1.4.1 文档 字符 串 


数 定 义 通常 包含 描述 这 个 函数 的 文档 ， 叫 做 文档 字符 串 ， 它 必须 在 函数 体 中 缩 进 。 文 档 字 
符 串 通常 使 用 三 个 引号 。 第 一 行 描述 函数 的 任务 。 随 后 的 一 些 行 描述 参数 ， 并 且 澄 清 函 数 的 
为 。 


欧 


>>> def pressure(v, t, n): 
”Compute thenpressuresimnpascalsof an deallogas. 


Applies the ideal gas law: http://en.wikipedia.org/wiki/Ideal gas_ law 


Vvolume ofngas neubac meters 
t -- absolute temperature in degrees kelvin 
nn particlessofhgas 
k = 1.38e-23 # Boltzmann's constant 
returmmn EA 


当 你 以 函数 名 称 作 为 参数 来 调用 help 时 ， 你 会 看 到 它 的 文档 字符 串 ( 按 下 q 来 退出 Python 
帮助 ) 。 


>>> help(pressure) 


编写 Python 程序 时 ， 除 了 最 简单 的 函数 之 外 ， 都 要 包含 文档 字符 串 。 要 记 住 ， 代 码 只 编写 一 
次 ， 但 是 会 阅读 多 次 。Python 文档 包含 了 文档 字符 串 准 则 ， 它 在 不 同 的 Python 项 目 中 保持 
一 致 。 


1.4.2 参数 默认 值 


定义 普通 函数 的 结果 之 一 就 是 额外 参数 的 引入 。 具 有 许多 参数 的 函数 调用 起 来 非常 麻烦 ， 也 
难以 阅读 。 


在 Python 中 ， 我 们 可 以 为 函数 的 参数 提供 默认 值 。 调 用 这 个 函数 时 ， 带 有 默认 值 的 参数 是 可 
选 的 。 如 果 它 们 没有 提供 ， 默 认 值 就 会 绑 定 到 形式 参数 的 名 称 上 。 例 如 ， 如 果 某 个 应 用 通常 
用 来 计算 一 摩尔 粒子 的 压强 ， 这 个 值 就 可 以 设 为 默认 : 

>>> k_b=1.38e-23 # Boltzmann's constant 


>>>"def pressure(v, t, n=6.0226e23): 
"compute the pressure in pascals of ‘an ideal gas. 


V -- Volume of gas, in cubic meters 
t -- absolute temperature in degrees kelvin 
n -- particles of gas (default: one mole) 


newman ka EY 
>>> pressure(1, 273.15) 
2269 ,974834 


这 里 ， pressure 的 定义 接受 三 个 参数 ， 但 是 在 调用 表达 式 中 只 提供 了 两 个 。 这 种 情况 
下 ，n 的 值 通过 def 语句 的 默认 值 获得 ( 它 看 起 来 像 对 n 的 赋值 ， 虽 然 就 像 这 个 讨论 暗示 
的 那样 ， 更 大 程度 上 它 是 条 件 赋值 ) 。 


作为 准则 ， 用 于 函数 体 的 大 多 数 数据 值 应 该 表示 为 具名 参数 的 默认 值 ， 这 样 便于 查看 ， 以 及 
被 函数 调用 者 修改 。 一 些 值 永远 不 会 改变 ， 就 像 基 本 常数 kb ， 应 该 定义 在 全 局 帧 中 。 


1.5 控制 


来 源 : 1.5 Control 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


我 们 现在 可 以 定义 的 函数 能 力 有 限 ， 因 为 我 们 还 不 知道 一 种 方法 来 进行 测试 ， 并 且 根 据 测 试 
结果 来 执行 不 同 的 操作 。 控 制 语句 可 以 让 我 们 完成 这 件 事 。 它 们 不 像 严 格 的 求 值 子 表达 式 那 
样 从 左 向 右 编写 ， 并 且 可 以 从 它们 控制 解释 器 下 一 步 做 什么 当中 得 到 它们 的 名 称 。 这 可 能 
于 表达 式 的 值 。 


1.5.1 话 句 


目前 为 止 ， 我 们 已 经 初步 | 我 们 已 经 看 到 了 三 种 语句 : 赋 
值 、 def 和 return 语句 。 这 些 Python 代码 并 不 是 表达 式 ， 虽 然 它 们 中 的 一 部 分 是 表达 式 。 


要 强调 的 是 ， 语 名 的 值 是 不 相干 的 〈 或 不 存在 的 ) ， 我 们 使 用 执行 而 不 是 求 值 来 描述 语句 。 
每 个 语句 都 描述 了 对 解释 器 状态 的 一 些 改 变 ， 执 行 语句 会 应 用 这 些 改变 。 像 我 们 之 前 看 到 
的 return 和 赋值 语句 那样 ， 语 名 的 执行 涉及 到 求解 所 包含 的 子 表达 式 。 


表达 式 也 可 以 作为 语句 执行 ， 其 中 它们 会 被 求 值 ， 但 是 它们 的 值 会 舍弃 。 执 行 纯 函 数 没有 什 
么 副作用 ， 但 是 执行 非 纯 函数 会 产生 效果 作为 函数 调用 的 结果 。 


考虑 下 面 这 个 例子 : 


>>> def square(Xx): 
mul(x, x) # Watch out! This call doesn't return a value. 


这 是 有 效 的 Python 代码 ， 但 是 并 不 是 想 表 达 的 意思 。 函 数 体 由 表达 式 组 成 。 表 达 式 本 身 是 个 
有 效 的 语句 ， 但 是 语句 的 效果 是 ，mul 函数 被 调用 了 ， 然 后 结果 被 含 育 了 。 如 果 你 希望 对 表 
达 式 的 结果 做 一 些 事情 3 你 需要 这 样 做 : 使 用 赋值 语句 来 储存 它 ? 或 者 使 用 return 语 句 将 它 
返回 : 


>>> def square(x): 
return mul(x, x) 


有 时 编写 一 个 函数 体 是 表达 式 的 函数 是 有 意义 的 ， 例 如 调用 类 似 print 的 非 纯 函数 : 


>>> def print_square(x) : 
print(square(x)) 


在 最 高 层级 上 ，Python 解释 器 的 工作 就 是 执行 由 语句 组 成 的 程序 。 但 是 ， 许 多 有 意思 的 计算 
工作 来 源 于 求解 表达 式 。 语 句 管理 程序 中 不 同 表达 式 之 间 的 关系 ， 以 及 它们 的 结果 会 怎么 
样 。 


1.5.2 复合 语句 


通常 ，Python 的 代码 是 语句 的 序列 。 一 条 简单 的 语句 是 一 行 不 以 分 号 结束 的 代码 。 复 合 语句 
之 所 以 这 么 命名 ， 因 为 它 是 其 它 (简单 或 复合 ) 语句 的 复合 。 复 合 语句 一 般 占 据 多 行 ， 并 且 
以 一 行 以 冒号 结尾 的 头 部 开始 ， 它 标识 了 语句 的 类 型 。 同 时 ， 一 个 头 部 和 一 组 缩 进 的 代码 电 
做 子 句 (或 从 句 ) 。 复 合 语句 由 一 个 或 多 个 子 句 组 成 。 


<header>: 
<statement> 
<statement> 


<separating header>: 


<statement> 
<statement> 


我 们 可 以 这 样 理解 我 们 已 经 见 到 的 语句: 

。 表达 式 、 返 回 语句 和 赋值 语 钨 都 是 简单 语 多 。 

e def 语句 是 复合 语句 。 def 头 部 之 后 的 组 定义 了 郊 数 体 。 

为 每 种 头 部 特 化 的 求 值 规 则 指导 了 组 内 的 语句 什么 时 候 以 及 是 否 会 被 执行 。 我 们 说 头 部 控制 

语句 组 。 例 如 ， 在 def 语句 的 例子 中 ， 我 们 看 到 返回 表达 式 并 不 会 立即 求 值 ， 而 是 储存 起 来 

用 于 以 后 的 使 用 ， 当 所 定义 的 函数 最 终 调用 时 就 会 求 值 。 

我 们 现在 也 能 理解 多 行 的 程序 了 。 

。 执行 语句 序列 需要 执行 第 一 条 语句 。 如 果 这 个 语句 不 是 重 定向 控制 ， 之 后 执行 语句 序列 
的 剩余 部 分 ， 如 果 存 在 的 话 。 

这 个 定义 揭示 出 递归 定义 "序列 ”的 基本 结构 : 一 个 序列 可 以 划分 为 它 的 第 一 个 元 素 和 其 余 元 

素 。 语 名 序列 的 "剩余 "部 分 也 是 一 个 语句 序列 。 所 以 我 们 可 以 递归 应 用 这 个 执行 规则 。 这 个 序 

列 作为 递归 数据 结构 的 看 法 会 在 随后 的 章节 中 再 次 出 现 。 

这 一 规则 的 重要 结果 就 是 语句 顺序 执行 ， 但 是 随后 的 语句 可 能 永远 不 会 执行 到 ， 因 为 有 重 定 

向 控制 。 

实践 指南 : 在 缩 进 代码 组 时 ， 所 有 行 必 须 以 相同 数量 以 及 相同 方式 缩 进 (空格 而 不 是 Tab) 。 

任何 缩 进 的 变动 都 会 导致 错误 。 


1.5.3 定义 函数 外: 局 部 赋值 


一 开始 我 们 说 ， 用 户 定义 函数 的 函数 体 只 由 带 有 一 个 返回 表达 式 的 一 个 返回 语句 组 成 。 实 际 
上 上 3 函数 可 以 定义 为 操作 的 序列 3 不 仅仅 是 一 条 表达 式 o Python 复合 语句 的 结构 自然 让 我 们 
将 函数 体 的 概念 扩展 为 多 个 语句 。 


无 论 用 户 定义 的 函数 何 时 被 调用 ， 定 义 中 的 子 句 序列 在 局 部 环境 内 执行 。 return 语句 会 重 定 
向 控制 : 无 论 什 么 时 候 执 行 return 语句 ， 遂 数 调 用 的 流程 都 会 中 止 ， 返 回 表达 式 的 值 会 作为 
被 调用 有 函数 的 返回 值 。 


于 是 ? 赋值 语句 现在 可 以 出 现在 函数 体 中 o 例如 这 个 函数 以 第 一 个 数 的 百分数 形式 , 要 


>>> def percent_ difference(x, y): 
difference = abs(x-y) 
return 100 * difference / x 
>>> percent_difference(40, 50) 
S50 


赋值 语句 的 效果 是 在 当前 环境 的 第 一 个 帧 上 ， 将 名 字 绑 定 到 值 上 。 于 是 ， 郊 数 体内 的 赋值 语 
名 不 会 影响 全 局 帧 。 有 函数 只 能 操作 局 部 作用 域 的 现象 是 创建 模块 化 程序 的 关键 ， 其 中 纯 函 数 
只 通过 它们 接受 和 返回 的 值 与 外 界 交 互 。 


当然 ， percent_difference 有 函数 也 可 以 写成 一 个 表达 式 ， 就 像 下 面 这 样 ， 但 是 返回 表达 式 会 
更 加 复杂 : 


>>>>"def percent difference(x ry): 
return 100 * abs(x-y) / x 


目前 为 止 ， 局 部 赋值 并 不 会 增加 郊 数 定义 的 表现 力 。 当 它 和 控制 语句 组 合 时 ， 才 会 这 样 。 此 
外 ， 局 部 赋值 也 可 以 将 名 称 赋 为 间接 量 ， 在 理 清 复杂 表达 式 的 含义 时 起 到 关键 作用 。 


新 的 环境 特性 : 局 部 赋值 。 


Python 拥有 内 建 的 绝对 值 函 数 : 
>>> abs(-2) 
2 
我 们 希望 自己 能 够 实现 这 个 函数 ， 但 是 我 们 当前 不 能 直接 定义 函数 来 执行 测试 并 做 出 选择 。 


我 们 希望 表达 出 ， 如 果 x 是 正 的 ，abs(x) 返回 x ， 如 果 x 是 0，abx(x) 返回 0， 否 
则 abs(x) 返回 -x 。Python 中 ， 我 们 可 以 使 用 条 件 语句 来 表达 这 种 选择 。 


>>> def absolute value(x): 
TITT "Compute abs(x) Tp 
> 
returnm x 
elif x == 0: 
return oe 
else: 
return -x 


>>> absolute_value(-2) == abs(-2) 
EU 


absolute_value 的 实现 展示 了 一 些 重要 的 事情 : 


条 件 语句 。Python 中 的 条 件 语句 包含 一 系列 的 头 部 和 语句 组 : 一 个 必要 的 if 子 句 ， 可 选 
的 elif 子 句 序列 ， 和 最 后 可 选 的 else 子 句 : 


if <expression>: 
<suite> 

elif <expression>: 
<suite> 

else: 
<suite> 


当 执 行 条 件 语句 时 ， 每 个 子 句 都 按 顺 序 处 理 : 


. 求 出 头 部 中 的 表达 式 。 
2， 如 果 它 为 监 ， 执 行 语句 组 。 之 后 ， 跳 过 条 件 语句 中 随后 的 所 有 子 句 。 


如 果 能 到 达 else 子 句 ( 仅 当 所 有 if 和 elif 表达 式 值 为 假 时 ) ， 它 的 语句 组 才 会 被 执行 


布尔 上 下 文 。 上 面 过 程 的 执行 提 到 了 “ 假 值 "和 “上 真 值 '。 条 件 块 头 部 语句 中 的 表达 式 也 叫 作 布尔 
上 下 文 : 它们 值 的 真 假 对 控制 流 很 重要 ， 但 在 另 一 方面 ， 它 们 的 值 永远 不 会 被 赋值 或 返回 。 

Python 包含 了 多 种 假 值 ， 包 括 0、 None 和 布尔 值 False 。 所 有 其 他 数值 都 是 真 值 。 在 第 二 
章 中 ， 我 们 就 会 看 到 每 个 Python 中 的 原始 数据 类 型 都 是 站 值 或 假 值 。 


布尔 值 。 Python 有 两 种 布尔 值 ， 叫 做 True 和 False 。 布 尔 值 表示 了 逻辑 表达 式 中 的 真 值 
内 建 的 比较 运算 符 ，> 、<、>=、<=、==、!= ， 返回 这 些 值 。 


SS>9A < 
False 
S55 = 5 
True 


第 二 个 例子 读 作 “5 大 于 等 于 5”， 对 应 operator 模块 中 的 函数 ge 。 


>>> 0 == -0 
True 


最 后 的 例子 读 作 “0 等 于 -0”， 对 应 operator 模块 的 eq 函数 。 要 注意 Python 区 分 赋值 
( = ) 和 相等 测试 ( == ) 。 许 多 语言 中 都 有 这 个 惯例 。 


布尔 运算 符 。Python 也 内 建 了 三 个 基本 的 逻辑 运算 符 : 


>>> True and False 
False 

>>> True or False 
imUG 

>>> not False 

True 


逮 辑 表达 式 拥有 对 应 的 求 值 过 程 。 这 些 过 程 揭示 了 逮 辑 表达 式 的 真 值 有 时 可 以 不 执行 全 部 子 
表达 式 而 确定 ， 这 个 特性 叫做 短路 。 


为 了 求 出 表达 式 <left> and <right> : 


1. 求 出 子 表达 式 <left> ° 
2.， 如果 结果 v 是 假 值 ， 那么 表达 式 求 值 为 v 。 
3， 否 则 表达 式 的 值 为 子 表达 式 <right> 。 


为 了 求 出 表达 式 <left> or <right> : 


1. 求 出 子 表达 式 <left> ° 
2.， 如果 结 果 v 是 丨 值 ， 那么 表达 式 求 值 为 v 。 
3， 否 则 表达 式 的 值 为 子 表达 式 <right> 。 


为 了 求 出 表达 式 not <exp> : 
1. 求 出 <exp> ， 如 果 值 是 True 那么 返回 值 是 假 值 ， 如 果 为 False 则 反之 。 


这 些 值 、 规 则 和 运 草 符 向 我 们 提供 了 一 种 组 合 测试 结果 的 方式 。 执 行 测试 以 及 返回 布尔 值 的 
函数 通常 以 is 开头 ， 并 不 带 下 划 线 (例如 isfinite 、 isdigit 、 isinstance 等 等 ) © 


1.5.5 迭代 


除了 选择 要 执行 的 语句 ， 控 制 语句 还 用 于 表达 重复 操作 。 如 果 我 们 编写 的 每 一 行 代码 都 只 执 
行 一 次 ， 程 序 会 变 得 非常 没有 生产 力 。 只 有 通过 语句 的 重复 执行 ， 我 们 才 可 以 释放 计算 机 的 
潜力 ， 使 我 们 更 加 强大 。 我 们 已 经 看 到 了 重复 的 一 种 形式 : 一 个 函数 可 以 多 次 调用 ， 虽 然 它 
只 定义 一 次 。 和 迭代 控制 结构 是 另 一 种 将 相同 语句 执行 多 次 的 机 制 。 


考虑 斐 波 那 契 数列 ， 其 中 每 个 数值 都 是 前 两 个 的 和 : 


(OD Te 2 


每 个 值 都 通过 重复 使 用 “前 两 个 值 的 和 ”的 规则 构造 。 为 了 构造 第 n 个 值 ， 我 们 需要 跟踪 我 们 创 
建 了 多 少 个 值 ( k ) ， 以 及 第 k 个 值 ( curr ) 和 它 的 上 一 个 值 ( pred ) ， 像 这 样 


> 


>>> def fib(n): 
"""Compute the nth Fibonacci number, for n >= 2.""" 
pred, curr = 0, 1 # Fibonacci numbers 


Kk # Position of curr in the sequence 
while k < n: 
pred, curr = curr, pred + curr # Re-bind pred and curr 
k=k+1 # Re-bind k 
return curr 
>>> fib(8) 


13 


要 记 住 去 号 在 赋值 语句 中 分 隔 了 多 个 名 称 和 值 。 这 一 


~ 


pred, curr = curr, pred + curr 


具有 将 curr 的 值 重 新 绑 定 到 名 称 pred 上 ， 以 及 将 pred + curr 的 值 重 新 绑 定 到 curr 上 的 效 
果 。 所 有 = 右边 的 表达 式 会 在 绑 定 发 生 之 前 求 出 来 。 


while 子 名 包含 一 个 头 部 表达 式 ， 之 后 是 语句 组 : 


while <expression>: 
<suite> 


为 了 执行 while 子 句 : 


1.， 求 出 头 部 表达 式 。 
2， 如 果 它 为 丨 ， 执 行 语句 组 ， 之 后 返回 到 步骤 11。 


在 步骤 2 中 ， 整 个 while 子 句 的 语句 组 在 头 部 表达 式 再 次 求 值 之 前 被 执行 。 
为 了 防止 while 子 句 的 语句 组 无 限 执行 ， 它 应 该 总 是 在 每 次 通过 时 修改 环境 的 状态 。 


不 终止 的 while 语句 叫做 无 限 循环 。 按 下 <control>-C 可 以 强制 让 Python 停止 循环 。 


1.5.6 实践 指南 : 测试 


函数 的 测试 是 验证 函数 的 行为 是 否 符 合 预期 的 操作 。 我 们 的 函数 现在 已 经 足够 复杂 了 ， 我 们 
需要 开始 测试 我 们 的 实现 。 


测试 是 系统 化 执行 这 个 验证 的 机 制 。 测 试 通常 写 为 另 一 个 函数 ， 这 个 函数 包含 一 个 或 多 个 被 
测 函 数 的 样 例 调用 。 返 回 值 之 后 会 和 预期 结果 进行 比 对 。 不 像 大 多 数 通 用 的 函数 ， 测 试 涉及 
到 挑选 特殊 的 参数 值 ， 并 使 用 它 来 验证 调用 。 测 试 也 可 作为 文档 : 它们 展示 了 如 何 调用 遂 
数 ， 以 及 什么 参数 值 是 合理 的 。 


要 注意 我 们 也 将 “测试 "这 个 词 用 于 if 或 while 语句 的 头 部 中 作为 一 种 技术 术语 。 当 我 们 
将 “测试 "这 个 词 用 作 表 达 式 ， 或 者 用 作 一 种 验证 机 制 时 ， 它 应 该 在 语 境 中 十 分 明显 。 


断言 。 程 序 员 使 用 assert 语句 来 验证 预期 ， 例 如 测试 函数 的 输出 。 assert 语句 在 布尔 上 
a 
表达 式 求 值 为 假 ， 它 就 会 显示 。 


>>> assert fib(8) == 13, 'The 8th Fibonacci number should be 13" 


当 被 断言 的 表达 式 求 值 为 夏 时 ， 断 言语 名 的 执行 没有 任何 效果 。 当 它 是 假 时 ， asset 会 造成 
执行 中 断 。 


为 fib 编写 的 test 函数 测试 了 几 个 参数 ， 包 含 n 的 极限 值 : 


>>> def fib_test(): 
assert fib(2) == 1, 'The 2nd Fibonacci number should be 1' 
assere fib(30== 1 Tnes3ndiErbonacecunumber shouLanben dl, 
assert fib(50) == 7778742049, 'Error at the S50Oth Fibonacci number' 


在 文件 中 而 不 是 直接 在 解释 器 中 编写 Python 时 ， 测 试 可 以 写 在 同一 个 文件 ， 或 者 后 级 
为 _test.py 的 相 邻 文件 中 。 


Doctest。Python 提供 了 一 个 便利 的 方法 ， 将 简单 的 测试 直接 写 到 元 数 的 文档 字符 串 内 。 文 
档 字符 串 的 第 一 行 应 该 包含 单行 的 函数 描述 ， 后 面 是 一 个 空 行 。 参 数 和 行为 的 详细 描述 可 以 
跟随 在 后 面 。 此 外 ， 文 档 字符 串 可 以 包含 调用 该 函数 的 简单 交互 式 会 话 : 


>>> def Sum_naturals(n): 
”Return the sum of the first n natural numbers 


>>> sum_naturals(10) 
SS 
>>> sum_naturals(100) 
5050 
total, k = 0, 1 
while k <= n: 
total, k = total + k, k + 1 
return total 


oh 
by 
hd 
候 
站 时 
发 
ey 


之 后 ， 可 以 使 用 doctest 模块 来 验证 交互 。 下 面 的 globals 函数 返回 全 


>>> from doctest import run_docstring _ examples 
>>> run_docstring_examples(sum naturals, globals()) 


在 文件 中 编写 Python 时 ， 可 以 通过 以 下 面 的 命令 行 选项 启动 Python 来 运行 一 个 文档 中 的 所 
有 doctest 。 


python3 -m doctest <python_source_file> 


高 效 测 试 的 关键 是 在 实现 新 的 函数 之 后 《甚至 是 之 前 ) 立即 编写 (以 及 执行 ) 测试 。 只 调用 
一 个 函数 的 测试 叫做 单元 测试 。 详 尽 的 单元 测试 是 良好 程序 设计 的 标志 。 


1.6 高 阶 防 数 


来 源 : 1.6 Higher-Order Functions 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


我 们 已 经 看 到 ， 函 数 实 际 上 是 描述 复合 操作 的 抽象 ， 这 些 操作 不 依赖 于 它们 的 参数 值 。 
在 square 中 a 


>>>" def square(Xx): 
return Xx x 


a 的 平方 ， 而 是 一 个 获得 任何 数值 平方 的 方法 。 当 然 ， 我 们 可 以 不 定义 
个 函数 来 使 用 它 过 始终 编写 这 样 的 表达 式 : 


>>>33. 9 
9 
>>>35 55 
25 


Ge square 。 这 种 实践 适合 类 似 square 的 简单 操作 。 但 是 对 于 更 加 复杂 
的 操作 会 变 得 困难 。 通 常 ， 缺 少 函 数 定义 会 对 我 们 非常 不 利 ， 它 会 强迫 我 们 始终 工作 在 特定 
操作 的 层 Re 个 例子 中 是 乘法 ) ， 而 不 是 高 级 操作 。 我 们 应 该 从 
强大 的 编程 语言 索取 的 东西 之 一 ， 是 通过 将 名 称 赋 为 常用 模式 来 构建 抽象 的 能 力 ， 以 及 之 后 
直接 使 用 抽象 的 能 力 。 函 数 提供 了 这 种 能 力 。 


我 们 将 会 在 下 个 例子 中 看 到 ， 代 码 中 会 反复 出 现 一 些 常 见 的 编程 模式 ， 但 是 使 用 一 些 不 同 函 
数 来 实现 。 这 些 模式 也 可 以 被 抽象 和 给 予 名 称 。 


为 了 将 特定 的 通用 模式 表达 为 具名 概念 ， 我 们 需要 构造 可 以 接受 其 他 函数 作为 参数 的 函数 ， 
或 者 将 函数 作为 返回 值 的 函数 。 操 作 遂 数 的 函数 叫做 高 阶 函 数 。 这 一 节 展 示 了 高 阶 函 数 可 用 
作 强 大 的 抽象 机 制 ， 极 大 提升 语言 的 表现 力 。 


1.6.1 作为 参数 的 函数 


考虑 下 面 三 个 函数 ， 它 们 都 计算 总 和 。 第 一 个 ， sum_naturals ， 计 算 截 至 n 的 自然 数 的 和 : 


>>> def Sum_naturals(n) : 
total, k = 0, 1 
while k <= n: 
total, k = total + k, k + 1 
return total 
>>> sum_naturals(100) 
5050 


第 二 个 ， sum_cubes ， 计 算 截至 n 的 自然 数 的 立方 和 : 


>>> def sum cubes(n): 
total, k = 0, 1 
while k <= n: 
total, k = total + pow(k, 3), k + 1 
return total 
>>> sum_cubes(100) 
25502500 


第 三 个 ， 计 算 这 个 级 数 中 式 子 的 和 : 
8 8 8 
1 BF ~ gd 


“3 
它 会 慢 慢 收敛 于 pi 。 


>>> def pi_sum(n): 
total, k = 0, 1 
while k <= n: 
total, k = total + 8 / (k * (k + 2)), k + 4 
return total 
>>> pi_sum(100) 
3.121594652591009 


这 三 个 函数 在 背后 都 具有 相同 模式 。 它 们 大 部 分 相同 ， 只 是 名 字 、 用 于 计算 被 加 项 的 k 的 函 
数 ， 以 及 提供 k 的 下 一 个 值 的 函数 不 同 。 我 们 可 以 通过 向 相同 的 模板 中 十 充 槽 位 来 生成 每 个 
函数 : 


def <name>(n): 
total, k = 0, 1 
while k <= n: 
total, k = total + <term>(k), <next>(k) 
return total 


这 个 通用 模板 的 出 现 是 一 个 强 有 力 的 证 据 ， 证 明 有 一 个 实用 抽象 正在 等 着 我 们 表现 出 来 。 这 
些 函 数 的 每 一 个 都 是 式 子 的 求 和 。 作 为 程序 的 设计 者 ， 我 们 希望 我 们 的 语言 足够 强大 ， 便 于 
我 们 编写 函数 来 自我 表达 求 和 的 概念 ， 而 不 仅仅 是 计算 特定 和 的 函数 。 我 们 可 以 在 Python 中 
使 用 上 面 展示 的 通用 模板 ， 并 且 把 槽 位 变 成 形式 参数 来 轻易 完成 它 。 


>>> def summation(n, term, next): 
total, k = 0, 1 
while k <= n: 
total, k = total + term(k), next(k) 
return total 


要 注意 summation 接受 上 界 n ， 以 及 函数 term 和 next 作为 参数 。 我 们 可 以 像 任何 函数 那样 
使 用 summation ， 它 简洁 吉 地 表达 了 求 和 8 


>>> def cube(k): 
return pow(k, 3) 
>>> def successor(k): 
retkuenek rl 
>>> def sum cubes(n): 
return summation(n, cube, successor) 
>>> sum_cubes(3) 
36 


使 用 identity 函数 来 返回 参数 自己 ， 我 们 就 可 以 对 整数 求 和 : 


>>>°defridentity(Kk): 
return k 
>>> def sum naturals(n): 
return summation(n, identity, successor) 
>>> sum_naturals(10) 
S55 


我 们 也 可 以 逐步 定义 pi_sum ， 使 用 我 们 的 summation 抽象 来 组 合 组 件 。 


>>>°def pia term(ky): 
denominator = k * (k + 2) 
return 8 / denominator 
>>>>defnpa mext(kK): 
return k + 4 
>>> def pi_sum(n): 
return summation(n, pi_term, pi_next) 
>>> pi_sum(1e6) 
3.1415906535898936 


1.6.2 作为 一 般 方 法 的 函数 


我 们 引入 的 用 户 定义 函数 作为 一 种 数值 运算 的 抽象 模式 ， 便 于 使 它们 独立 于 涉及 到 的 特定 数 
值 。 使 用 高 阶 函 数 ， 我 们 开始 寻找 更 强大 的 抽象 类 型 : 一 些 函数 表达 了 计算 的 一 般 方法 ， 独 
立 于 它们 调用 的 特定 函数 。 


尽管 函数 的 意义 在 概念 上 扩展 了 ， 我 们 对 于 如 何 求解 调用 表达 式 的 环境 模型 也 优雅 地 延伸 到 
了 高 阶 函 数 ， 没 有 任何 改变 。 当 一 个 用 户 定义 元 数 以 一 些 实 参 调用 时 ， 形 式 参 数 会 在 最 新 的 
局 部 帧 中 绑 定 实 参 的 值 (它们 可 能 是 函数 ) 。 


人 。 和 迭代 改进 算 
法 以 一 个 方程 的 解 的 guess (推测 值 ) 开始 。 它 重复 调用 update 函数 来 改进 这 个 推测 值 ， 并 
且 调 用 test 来 检查 是 否 当 前 的 guess“ 足 够 接近 "所 认为 的 正确 值 。 


>>> def iter_improve(update, test, guess=1): 
while not test(guess): 
guess = update(guess) 
return guess 


test 函数 通常 检查 两 个 函数 f 和 g 在 guess 值 上 是 否 彼 此 接近 。 测 试 f(x) 是 否 接近 
于 g(x) 也 是 计算 的 一 般 方 法 。 


Sdef mear(t rd 
return approx_eq(f(x), g(x)) 


程序 中 测试 相似 性 的 一 个 常见 方式 是 将 数值 差 的 绝对 值 与 一 个 微小 的 公差 值 相 比 : 


>>> def approx_eq(x, y, tolerance=1e-5): 
return abs(x - y) < tolerance 


黄金 比例 ， 通 常 叫 做 phi ， 是 经 常 出 现在 自然 、 艺 术 、 和 建筑 中 的 数值 。 它 可 以 通 
过 iter_improve 使 用 golden_update 来 计算 ， 并 且 在 它 的 后 继 等 于 它 的 平方 时 收敛 。 
>>> def golden_update(guess ) : 
return i/guess + 1 


>>>°def goldenBtest(guess): 
return near(guess, square, successor) 


这 里 ， 我 们 已 经 向 全 局 帧 添加 了 多 个 绑 定 。 郊 数值 的 描述 为 了 简短 而 有 所 删节 : 
golden_update: 


golden_test: 


”| golden test 
| zter_Improve 


iter_improve: 


Near: 

| near 
square: 
8 | square 
lincrement: 


| increment 


使 用 golden_update 和 golden_test 参数 来 调用 iter_improve 会 计算 出 黄金 比例 的 近似 值 。 


>>> iter_improve(golden update, golden test) 
1.6180371352785146 


通过 跟踪 我 们 的 求 值 过 程 的 步骤 ， 我 们 就 可 以 观察 结果 如 何 计 算 。 首 先 ， iter_improve 的 局 
部 帧 以 update 、 test 和 guess 构建 。 在 iter_improve 的 函数 体 中 ， 名 称 test 绑 定 

到 golden_test 上 ， 它 在 初始 值 guess 上 调用 。 之 后 ， golden_test 调用 near ， 创 建 第 三 个 
局 部 帧 ， 它 将 形式 参数 ff 和 g 绑 定 到 square 和 successor 上 。 












golden_update: Y 
>19° lden_update 
golden_test: 
， > | golden test Ls 
lter_improve: 四 
= iter_improve 
Loear L_ 
> Lsq9uare L_ 
>| increment 洗 


near: 
square: 


increment: 


iter_improve | x: 1 | 


golden_test 






Near 


完成 near 的 求 值 之 后 ， 我 们 看 到 golden_test 为 False ， 因 为 1 并 不 非常 接近 于 2。 所 
以 ， while 子 句 代码 组 内 的 求 值 过 程 ， 以 及 这 个 机 制 的 过 程 会 重复 多 次 。 


这 个 扩展 后 的 例子 展示 了 计算 机 科学 中 两 个 相关 的 重要 概念 。 首 先 ， 命 名 和 函数 允许 我 们 抽 
象 而 远离 大 量 的 复杂 性 。 当 每 个 函数 定义 不 重要 时 ， 由 求 值 过 程 触发 的 计算 过 程 是 相当 复杂 
的 ， 并 且 我 们 甚至 不 能 展示 所 有 东西 。 其 次 ， 基 于 事实 ， 我 们 拥有 了 非常 通用 的 求 值 过 程 ， 
小 的 组 件 组 合 在 复杂 的 过 程 中 。 理 解 这 个 过 程 便 于 我 们 验证 和 检查 我 们 创建 的 程序 。 


像 通常 一 样 ， 我 们 的 新 的 一 般 方法 iter_improve 需要 测试 来 检查 正确 性 。 黄 金 比例 可 以 提供 
这 样 一 个 测试 ， 因 为 它 也 有 一 个 财 式 解 ， 我 们 可 以 将 它 与 选 代 结 果 进 行 比较 。 
>>> phi = 1/2 + pow(5, 1/2)/2 
>>> def near test(): 
assert near(phi, square, successor), 'phi * phi is not near phi + 1' 
>>> def iter improve test(): 


approx_phi = iter_improve(golden_ update, golden test) 
assert approx_eq(phi, approx_phi), 'phi differs from its approximation' 


新 的 环境 特性 : 高 阶 函 数 。 


附加 部 分 : 我 们 在 测试 的 证 明 中 遗漏 了 一 步 。 求 出 公差 值 e 的 范围 ， 使 得 如 
果 tolerance 为 e 的 near(x，square，successor) 和 值 为 监 ， 那 么 使 用 相同 公差 值 
的 approx_eq(phi, x) 值 为 卜 有 


1.6.3 定义 函数 川 : 上苍 套 定义 


上 面 的 例子 演示 了 将 函数 作为 参数 传递 的 能 力 如 何 提高 了 编程 语言 的 表现 力 。 每 个 通用 的 概 
念 或 方程 都 能 映射 为 自己 的 小 型 函数 ， 这 一 2 仆 负 面 效 果 是 全 局 帧 会 被 小 型 函数 弄 

乱 。 另 一 个 问题 是 我 们 限制 于 特定 函数 的 签 iter_improve 的 update 参数 必须 只 接受 一 个 
参数 。Python 中 ， 髓 套 函 数 的 定义 解决 了 这 些 问 题 ， 但 是 需要 我 们 重新 修改 我 们 的 模型 。 


让 我 们 考虑 一 个 新 问题 : 计算 一 个 数 的 平方 根 。 重 复 调 用 下 面 的 更 新 操作 会 收 化 于 x 的 平方 
根 : 


>>>>def average(x, y): 
return (x + y)/2 
>>> def sqrt update(guess, x): 
return average(guess, x/guess) 


这 个 带 有 两 个 参数 的 更 新 函数 和 iter _improve 不 兼容 ， 并 且 它 只 提供 了 一 个 介 值 。 我 们 实际 
上 只 关心 最 后 的 平方 根 。 这 些 问 题 的 解决 方案 是 把 函数 放 到 其 他 定义 的 函数 体 中 。 


>>> def square_root(x): 
def update(guess): 
return average(guess, x/guess) 
def test(guess): 
return approx_eq(square(guess), x) 
return iter_improve(update, test) 


就 像 局 部 赋值 ， 局 部 的 def 语 旬 仅仅 影响 当前 的 局 部 帧 。 这 些 函 数 仅仅 当 square_root 求 值 
时 在 作用 域内 。 和 求 值 过 程 一 致 ， 局 部 的 def 语句 在 square_root 调用 之 前 并 不 会 求 值 。 


词法 作用 域 。 局 部 定义 的 函数 也 可 以 访问 它们 定义 所 在 作用 域 的 名 称 绑 定 。 这 个 例子 

中 ” Update 引用 了 名 称 x ， 它 是 外 层 函数 square_root 的 一 个 形 参 。 这 种 在 褒 套 函数 中 共享 
名 称 的 规则 叫做 词法 作用 域 。 严 格 来 说 ， 内 部 函数 能 够 访问 定义 所 在 环境 〈 而 不 是 调用 所 在 
位 置 ) 的 名 称 。 


我 们 需要 两 个 对 我 们 环境 的 扩展 来 兼容 词法 作用 域 。 


1， 每 个 用 户 定义 的 函数 都 有 一 个 关联 环境 : 它 的 定义 所 在 的 环境 。 
2， 当 一 个 用 户 定义 的 函数 调用 时 ， 它 的 局 部 帧 扩展 于 元 数 所 关联 的 环境 。 


回 到 square_root ， 所 有 函数 都 在 全 局 环境 中 定义 ， 所 以 它们 都 关联 到 全 局 环境 ， 当 我 们 求 
解 square_root 的 前 两 个 子 甸 时 ， 我 们 创建 了 关联 到 局 部 环境 的 函数 。 在 


>>> Square_root(256 ) 
16.00000000000039 


的 调用 中 ， 环 境 首先 添加 了 square_root 的 局 部 帧 ， 并 且 求 出 def 语句 update 和 test (只 
展示 了 update ) 


1.6 高 阶 函 数 











square_root: Mm) 
lsquare_root A 
iter_improve: 仆 
人 iter_improve 到 一 
Square : 人 
sas 下 square es, 


Update(g): L_ 


"a return average(g, x/g) 
A sqrt_iter 
def square_root(x): 
square_root (256) def update(g): 


Pdef update(g): return avg(g, x/g) 
( return avg(g, x/g) es 
return iter_improve(...) 
return iter_improve(...)) 四 Square_root(256) 





随后 ， update 的 名 称 解 析 到 这 个 新 定义 的 函数 上 ， 它 是 向 iter_improve 传 入 的 参数 。 

在 iter_improve 的 函数 体 中 ， 我 们 必须 以 初始 值 1 调用 update 函数 。 最 后 的 这 个 调用 以 一 
开始 只 含有 g 的 局 部 帧 创建 了 update 的 环境 ， 但 是 之 前 的 square_root 帧 上 仍旧 含有 x 的 
绑 定 。 


Square_root : 
iter_improve: 


Square ， (人 仙 
nae 下 Square -大 


Update(g): L_ 


| return average(g, x/g) 


sqrt_iter 





update 


个 求 值 过 程 中 ， 最 重要 包 
A 色 箭 3 


人 函数 所 关联 的 环境 变 成 了 局 部 帧 ， 它 是 函数 求 值 的 地 方 。 


全 
也 薄 
El 
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以 这 种 方式 ， update 的 函数 体能 够 解析 名 称 x 。 所 以 我 们 意识 到 了 词法 作用 域 的 两 个 关键 
优势 。 


。 局 部 函数 的 名 称 并 不 影响 定义 所 在 函数 外 部 的 名 称 ， 因 为 局 部 函数 的 名 称 绑 定 到 了 定义 
处 的 当前 局 部 环境 中 ， 而 不 是 全 局 环境 。 

。 局 部 函数 可 以 访问 外 层 函 数 的 环境 。 这 是 因为 局 部 函数 的 函数 体 的 求 值 环境 扩展 于 定义 
处 的 求 值 环境 。 


update 苑 数 自 WR 也 就 是 在 定义 处 环境 中 的 数据 。 因为 它 以 这 文 种 方式 封装 言 息 2 
局 部 定义 的 函数 通常 叫做 闭 包 


新 的 环境 特性 : 局 部 函数 定义 。 


1.6.4 作为 返回 值 的 函数 


我 们 的 程序 可 以 通过 创建 返回 值 是 它们 本 身 的 函数 ， 获 得 更 高 的 表现 力 。 带 有 词法 作用 域 的 
编程 语言 的 一 个 重要 特性 就 是 ， 局 部 定义 函数 在 它们 返回 时 仍旧 持 有 所 关联 的 环境 。 下 面 的 
例子 展示 了 这 一 特性 的 作用 。 


在 定义 了 许多 简单 函数 之 后 ， composition 是 包含 在 我 们 的 编程 语言 中 的 自然 组 合法 。 也 就 是 
说 ， 提 供 两 个 函数 f(x) 和 g(x) ， 我 们 可 能 te， 义 h(x) = f(g(x)) 。 我 们 可 以 使 用 现 有 工 
具 来 定义 复合 函数 : 
>>> def compose1(f, g): 
def h(x): 
return f(g(x)) 
return h 
>>> add_one_and_square = compose1(square, successor) 


>>> add_one_and_square(12) 
169 


composel 中 的 1 表明 复合 函数 和 返回 值 都 只 接受 一 个 参数 。 这 种 命名 惯例 并 不 由 解释 器 强 
制 ，1 只 是 函数 名 称 的 一 部 分 


这 里 ， 我 们 开始 观察 我 们 在 计算 的 复杂 模型 中 投入 的 回报 。 我 们 的 环境 模型 不 需要 任何 修改 
就 能 支持 以 这 种 方式 返回 函数 的 能 力 。 


1.6.5 Lambda 表达 式 


目前 为 止 ， 每 次 我 们 打算 定义 新 的 函数 时 ， 我 们 都 会 给 它 一 个 名 称 。 但 是 对 于 其 它 类 型 的 表 
达 式 ， 我 们 不 需要 将 一 个 间接 产物 关联 到 名 称 上 。 也 就 是 说 ， 我 们 可 以 计算 arb + c*d ， 而 
不 需要 给 子 表达 式 arb 或 cxd ， 或 者 整个 表达 式 来 命名 。Python 中 ， 我 们 可 以 使 用 Lambda 
表达 式 赁 空 创建 函数 ， 它 会 求 值 为 匿名 函数 。Lambda 表达 式 是 函数 体 具 有 单个 返回 表达 式 的 
函数 ， 不 允许 出 现 赋值 和 控制 语句 。 


Lambda 表达 式 十 分 受 限 : 它们 仅仅 可 用 于 简单 的 单行 函数 ， 求 解 和 返回 一 个 表达 式 。 在 它们 
适用 的 特殊 情形 中 ，Lambda 表达 式 具 有 强大 的 表现 力 。 


>>> def compose1(f,g): 
return lambda x: f(g(x)) 


我 们 可 以 通过 构造 相应 的 英文 语句 来 理解 Lambda 表达 式 : 


lambda x , f(g(x)) 
"A function that takes x and returns (XDD 


一 些 程序 员 发 现 使 用 Lambda 表达 式 作为 匿名 有 函数 非常 简短 和 直接 。 人 但是， 复合 的 Lambda 
表达 式 非 常 难以 辨认 ， 尽 管 它们 很 简洁 。 下 面 的 定义 是 是 正确 的 ， 但 是 许多 程序 员 不 能 很 快 
地 理解 它 : 


>>> compose1 = lambda f,g: lambda x: f(g(x)) 


通常 ，Python 的 代码 风格 倾向 于 显 式 的 def 语句 而 不 是 Lambda 表达 式 ， 但 是 允许 它们 在 简 

单 函数 作为 参数 或 返回 值 的 情况 下 使 用 。 

这 种 风格 规范 不 是 准则 ， 你 可 以 想 怎 么 写 就 怎 ， 但是， 在 你 编写 程序 时 ， 要 考虑 某 一 天 

ee 

Lambda 的 术语 是 一 个 历史 的 偶然 结果 ， 来 源 于 手写 的 数学 符号 和 早期 打字 系统 限制 的 不 兼 
使 用 lambda 来 引入 过 程 或 函数 看 起 来 是 不 正当 的 。 这 个 符号 要 追溯 到 Alonzo Church ， 

他 在 20 世纪 30 年 代 开 始 使 用 “帽子 ”符号 ; 他 把 平方 函数 记 为 9 .yxy。 但 是 失败 的 
打字 员 将 这 个 帽子 移 到 了 参数 左边 ， ee 大 写 的 lambda: Ay .yxy ;之 
后 大 写 的 lambda 就 变 成 了 小 写 ， 现 在 我 们 就 会 在 数学 书 里 看 到 Xy . y x y ， 以 及 在 

Lisp 里 看 到 (lambda (y) (* y y)) ° 


-- Peter Norvig (norvig.com/lispy2.html) 


尽管 它 的 词 源 不 同 寻常 ，Lambda 表达 式 和 函数 调用 相应 的 形式 语言 ， 以 及 Lambda 演算 都 
成 为 了 计算 机 科学 概念 的 基础 ， 并 在 Python 编程 社区 广泛 传播 。 当 我 们 学 习 解 释 器 的 设计 
时 ， 我 们 将 会 在 第 三 章 中 重新 碰 到 这 个 话题 。 


1.6.6 示例 : 牛顿 法 


最 后 的 扩展 示例 展示 了 地 数值 、 局 部 定义 和 Lambda 表达 式 如何 一 起 工作 来 简明 地 表达 通常 
的 概念 。 


牛顿 法 是 一 个 传统 的 选 代 方 法 ， 用 于 寻找 使 数学 函数 返回 值 为 零 的 参数 。 这 些 值 叫做 一 元 数 
学 函数 的 根 。 寻 找 一 个 函数 的 根 通 常 等 价 于 求解 一 个 相关 的 数学 方程 。 


e。 16 的 平方 根 是 满足 Square(x) - 16 = 0 的 x 值 。 
e 以 2 为 底 32 的 对 数 (例如 2 与 某 个 指数 的 宽 为 32) 是 满 
足 pow(2， x) - 322=0 的 x 和 值 。 


所 以 ， 求 根 的 通用 方法 会 向 我 们 提供 算法 来 计算 平方 根 和 对 数 。 而 有 全 ， 我 们 想 要 计算 根 的 等 
式 只 包含 简单 操作 : 乘法 和 乘 方 。 


在 我 们 继续 之 前 有 个 注解 : 我 们 知道 如 何 计 算 平方 根 和 对 数 ， 这 个 事实 很 容易 当做 自然 的 事 
情 。 并 不 只 是 Python， 你 的 手机 和 计算 机 ， 可 能 甚至 你 的 手表 都 可 以 为 你 做 这 件 事 。 但 是 ， 
学 习 计 算 机 科学 的 一 部 分 是 弄 懂 这 些 数 如 何 计算 ， 而 有 全， 这 里 展示 的 通用 方法 可 以 用 于 求解 
大 量 方程 ， 而 不 仅仅 是 内 建 于 Python 的 东西 。 


在 开始 理解 牛顿 法 之 前 ， 我 们 可 以 开始 编程 了 。 这 就 是 函数 抽象 的 威力 。 我 们 简单 地 将 之 前 
的 语句 翻译 成 代码 : 
>>> def square_root(a): 
return find_root(lambda x: square(x) - a) 


>>> def logarithm(a, base=2): 
return find_root(lambda x: pow(base, x) - a) 


当然 ， 在 我 们 定义 find_root 之 前 ， 现 在 还 不 能 调用 任何 函数 ， 所 以 我 们 需要 理解 牛顿 法 如 
何 工 作 。 

牛顿 法 也 是 一 个 迭代 改进 算法 : 它 会 改进 任何 可 导 函 数 的 根 的 推测 值 。 要 注意 我 们 感 兴趣 的 
两 个 函数 都 是 平滑 的 。 对 于 


e f(x) = square(x) - 16 ( 细 线 ) 
©® f(x) = pow(2, x) - 32 ( 粗 线 ) 


在 二 维 平面 上 画 出 x 对 f(x) 的 图 像 ， 它 展示 了 两 个 函数 都 产生 了 光滑 的 曲线 ， 它 们 在 茶 个 
点 穿 过 了 0。 





由 于 它们 是 光滑 的 (可 导 的 ) ， 这 些 曲 线 可 以 通过 任何 点 上 的 直线 来 近似 。 牛 顿 法 根据 这 些 
线性 的 近似 值 来 寻找 函数 的 根 。 


想象 经 过 点 (x，f(x)) 的 一 条 直线 ， 它 与 函数 f(x) 的 曲线 在 这 一 点 的 斜率 相同 。 这 样 的 直线 
叫做 切线 ， 它 的 斜 牵 叫做 咎 在 x 上 的 导数 。 


这 条 直线 的 斜率 是 函数 值 改变 量 与 函数 参数 改变 量 的 比值 。 所 以 ， 按 照 f(x) 除 以 这 个 斜率 来 
平移 x ， 就 会 得 到 切线 到 达 0 时 的 x 值 。 





我 们 的 牛顿 更 新 操作 表达 了 跟随 这 条 切线 到 零 的 计算 过 程 。 我 们 通过 在 非常 小 的 区 间 上 计算 
函数 斜率 来 近似 得 到 函数 的 导数 。 


>>> def approx derivative(f, x, delta=1e-5): 
df = f(x + delta) - f(x) 
return df/delta 
>>> def newton_update(f): 
def update(x): 
return x - f(x) / approx_derivative(f, x) 
return update 


最 后 ， 我 们 可 以 定义 基于 newton_update (我 们 的 和 迭代 改进 算法 ) 的 find_root 函数 ， 以 及 一 
个 测试 来 观察 f(x) 是 否 接近 于 0。 我 们 提供 了 一 个 较 大 的 初始 推测 值 来 提升 logarithm 的 性 


全 
月 忆 2 


>>> def find root(f, initial guess=10): 

def Eest(x): 

return approx_eq(f(x), 0) 

return iter_improve(newton update(f), test, initial guess) 
>>> square_root(16) 
4.000000000026422 
>>> logarithm(32, 2) 
5.000000094858201 


当 你 实验 牛顿 法 时 ， 要 注意 它 不 总 是 收敛 的 。 iter_improve 的 初始 推测 值 必 须 足 够 接近 于 


大 的 通用 计算 方法 。 实 际 上 ， 非 常 快速 的 对 数 算法 和 大 整数 除法 也 采用 这 个 技巧 的 变 体 。 


1.6.7 抽象 和 一 等 苞 数 


这 一 节 的 开始 ， 我 们 以 观察 用 户 定义 函数 作为 关键 的 抽象 技巧 ， 因 为 它们 让 我 们 能 够 将 计算 
的 通用 方法 表达 为 编程 语言 中 的 显 式 元 素 。 现 在 我 们 已 经 看 到 了 高 阶 函 数 如 何 让 我 们 操作 这 
些 通用 方法 来 进一步 创建 抽象 。 


作为 程序 员 ， 我 们 应 该 留意 识别 程序 中 低级 抽象 的 机 会 ， 在 它们 之 上 构建 ， 并 泛 化 它们 来 创 
建 更 加 强大 的 抽象 。 这 并 不 是 说 ， 一 个 人 应 该 总 是 尽 可 能 以 最 抽象 的 方式 来 编程 ; 专家 级 程 
序 员 知 道 如 何 选择 合适 于 他 们 任务 的 抽象 级 别 。 但 是 能 够 基于 这 些 抽 象 来 思考 ， 以 便 我 们 在 
新 的 上 下 文中 能 使 用 它们 十 分 重要 。 高 阶 函 数 的 重要 性 是 ， 它 允许 我 们 更 加 明显 地 将 这 些 抽 
象 表达 为 编程 语言 中 的 元 素 ， 使 它们 能 够 处 理 其 它 的 计算 元 素 。 


通常 ， 编 程 语言 会 限制 操作 计算 元 素 的 途径 。 带 有 最 少 限制 的 元 素 被 称 为 具有 一 等 地 位 。 一 
些 一 等 元 素 的 “权利 和 特权 "是 : 


它们 可 以 绑 定 到 名 称 。 
它们 可 以 作为 参数 向 函数 传递 。 
它们 可 以 作为 函数 的 返回 和 值 返 回 。 
它们 可 以 包含 在 数据 结构 中 。 


De 


Python 总 是 给 予 函数 一 等 地 位 ， 所 产生 的 表现 力 的 收益 是 巨大 的 。 另 一 方面 ， 控 制 结构 不 能 
做 到 : 你 不 能 像 使 用 sum 那样 将 if 传 给 一 个 函数 。 


> 米 1 注 & 
1.6.8 有 函数 装饰 左 
Python 提供 了 特殊 的 语法 ， 将 高 阶 函 数 用 作 执 行 def 语句 的 一 部 分 ， 叫 做 装饰 器 。 


>>> def tracei(fn): 
def wrapped(x): 
print('-> fn, a xX, 
return fn(x) 
return wrapped 
>>> @tracel 
def triple(x): 
ietsneee ex 
>>> triple(12) 
-> <function triple at Ox102a39848> ( 12 ) 
36 


这 个 例子 中 ， 定 义 了 高 阶 函 数 tracel ， 它 返回 一 个 函数 ， 这 个 函数 在 调用 它 的 参数 之 前 执 
行 print 语句 来 输出 参数 。 triple 的 def 语句 拥有 一 个 注解 ” @trace1 ， 它 会 影响 def 的 
执行 规则 。 像 通常 一 样 ， 遂 数 triple 被 创建 了 ， 但 是 ， triple 的 名 称 并 没有 绑 定 到 这 个 函 


数 上 ， 而 是 绑 定 到 了 在 新 定义 的 函数 triple 上 调用 tracel 的 返回 函数 值 上 。 在 代码 中 ， 
个 装饰 器 等 价 于 : 


>>> def triple(x): 
retunn se x 
>>> triple = tracei(triple) 


人 : 实际 规则 是 ， 装 饰 器 符号 @ 可 以 放 在 表达 式 前 面 ( etracel 仅仅 是 一 个 简单 的 表 

达 式 ， 由 单一 名 称 组 成 ) 。 任 何 产生 合适 的 值 的 表达 式 都 可 以 。 例 如 ， 使 用 合适 的 值 ， 你 可 
以 定义 装饰 器 check_range ， 使 用 @check_range(1，16) 来 装饰 函数 定义 ， 这 会 检查 函数 的 结 
果 来 确保 它们 是 1 到 10 的 整数 。 调 用 check_range(1,10) 会 返回 一 个 函数 ， 之 后 它 会 用 在 新 
定义 的 函数 上 ， 在 新 定义 的 函数 绑 定 到 def 语句 中 的 名 称 之 前 。 感 兴趣 的 同学 可 以 阅读 Ariel 
Ortiz 编写 的 一 篇 装饰 器 的 简短 教程 来 了 解 更 多 的 例子 


第 二 草 使 用 对 象 构建 抽象 


2.1 引言 


来 源 : 2.1 Introduction 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


在 第 一 章 中 ， 我 们 专注 于 计算 过 程 ， 以 及 程序 设计 中 函数 的 作用 。 我 们 看 到 了 如 何 使 用 原始 
数据 (数值 ) 和 原始 操作 (算术 运算 ) ， 如 何 通过 组 合 和 控制 来 形成 复合 函数 ， 以 及 如 何 通 
过 给 予 过 程 名 称 来 创建 函数 抽象 。 我 们 也 看 到 了 高 阶 函 数 通过 操作 通用 计算 方法 来 提升 语言 
的 威力 。 这 是 编程 的 本 质 。 


这 一 章 会 专注 于 数据 。 数 据 允许 我 们 通过 使 用 已 经 获得 的 计算 工具 ， 表 示 和 操作 与 世界 有 关 
的 信息 。 脱 离 数据 结构 的 编程 可 能 会 满足 于 探索 数学 特性 ， 但 是 芙 实 世 界 的 情况 ， 比 如 广 
档 、 关 系 、 城 市 和 气候 模式 ， 都 拥有 复杂 的 结构 ， 它 最 好 使 用 复合 数据 类 型 来 表现 。 归 功 于 
互联 网 的 高 速 发 展 ， 关 于 世界 的 大 量 结构 信息 可 以 免费 从 网 上 获得 。 


2.1.1 对 詹 隐 喻 


在 这 门 课 的 开始 ， 我 们 区 分 了 函数 和 数据 : 函数 执行 操作 ， 而 数据 被 操作 。 当 我 们 在 数据 中 
包含 函数 值 时 ， 我 们 承认 数据 也 拥有 行为 。 兄 数 可 以 像 数 据 一 样 被 操作 ， 但 是 也 可 以 被 调用 
来 执行 计算 。 

在 这 门 课 中 ， 对 象 作为 我 们 对 数据 值 的 核心 编程 隐喻 ， 它 同样 拥有 行为 。 对 象 表示 信息 ， 但 
是 同时 和 它们 所 表示 的 抽象 概念 行为 一 致 。 对 象 如 何 和 其 它 对 象 交 互 的 逻辑 ， 和 编码 对 象 值 
的 信息 绑 定 在 一 起 。 在 打印 对 象 时 ， 它 知道 如 何以 字母 和 数字 把 自己 拼写 出 来 。 如 果 一 个 对 
象 由 几 部 分 组 成 ， 它 知道 如 何 按照 要 求 展示 这 些 部 分 。 对 象 既 是 信息 也 是 过 程 ， 它 们 绑 定 在 
一 起 来 展示 复杂 事物 的 属性 、 交 互 和 行为 。 

Python 中 所 实现 的 对 象 隐 喻 具有 特定 的 对 象 语法 和 相关 的 术语 ， 我 们 会 使 用 示例 来 介绍 。 日 
期 ( date ) 就 是 一 种 简单 对 象 。 


>>> from datetime import date 


date 的 名 字 绑 定 到 了 一 个 类 上 面 。 类 表示 一 类 对 象 。 独 立 的 日 期 叫做 这 个 类 的 实例 ， 它 们 可 
以 通过 像 函 数 那样 在 参数 上 调用 这 个 类 来 构造 ， 这 些 参数 描述 了 实例 。 


>>> today = date(2011, 9, 12) 


虽然 today 从 原始 数值 中 构造 ， 它 的 行为 就 像 日 期 那样 。 例 如 ， 将 它 与 另 一 个 日 期 相 减 会 得 
到 时 间 差 ， 它 可 以 通过 调用 str 来 展示 为 一 行文 本 : 


>>> str(date(2011, 12, 2) - today) 
:8 days” .000u00 


对 象 拥 有 属性 ， 它 们 是 带 有 名 字 的 值 ， 也 是 对 象 的 一 部 分 。Python 中 ， 我 们 使 用 点 运算 符 来 
访问 对 象 属性 : 


<expression> . <nNname> 


上 面 的 <expression> 求 值 为 对 象 ， <name> 是 对 象 的 某 个 属性 名 称 。 


不 像 我 们 之 前 见 过 的 名 称 ， 这 些 属性 名 称 在 一 般 的 环境 中 不 可 用 。 反 之 ， 属 性 名 称 是 点 运算 
符 之 前 的 对 象 实例 的 特定 部 分 。 


>>> today ,year 
911 


对 象 也 拥有 方法 ， 它 是 值 为 函数 的 属性 。 在 隐 哈 上， 对象“ 知道 "如 何 执行 这 些 方法 。 方 法 从 它 
们 的 参数 和 对 象 中 计算 出 它们 的 结果 。 例 如 ， today 的 strftime 方法 接受 一 个 指定 如 何 展 示 
日 期 的 参数 (例如 %A 表示 星期 几 应 该 以 全 称 拼 写 ) 。 


>>> today.strftime('%A, %B %d ' ) 
"Monday，September 12， 


计算 strftime 的 返回 值 需要 两 个 输入 : 描述 输出 格式 的 字符 串 ， 以 及 绑 定 到 today 的 日 期 信 
息 。 这 个 方法 使 用 日 期 特定 的 逻辑 来 产生 结果 。 我 们 从 不 会 说 2011 年 九 月 十 二 日 是 星期 一 ， 
但 是 知道 一 个 人 的 工作 日 是 日 期 的 一 部 分 。 通 过 绑 定 行为 和 信息 ，Python 对 象 提 供 了 可 靠 、 
独立 的 日 期 抽象 。 


点 运算 符 在 Python 中 提供 了 另 一 种 组 合 表 达 式 。 点 运算 符 拥有 定义 好 的 求 值 过 程 。 但 是 ， 点 
运算 符 如 何 求 值 的 精确 解释 ， 要 等 到 我 们 引入 面向 对 象 编程 的 完整 范式 ， 在 几 节 之 后 。 


即使 我 们 还 不 能 精确 描述 对 象 如 何 工 作 ， 我 们 还 是 可 以 开始 将 数据 看 做 对 象 ， 因 为 Python 中 
万 物 恬 对 象 。 


2.1.2 原始 数据 类 型 
Python 中 每 个 对 象 都 拥有 一 个 类 型 。 type 函数 可 以 让 我 们 查看 对 象 的 类 型 。 


>>> type(today ) 
<class 'datetime.date'> 


目前 为 止 ， 我 们 学 过 的 对 象 类 型 只 有 数值 、 函 数 、 布 尔 值 和 现在 的 日 期 。 我 们 也 碰 到 了 集合 
和 字符 串 ， 但 是 需要 更 深入 地 学 习 它 们 。 有 许多 其 它 的 对 象 类 型 -- 声音 、 图 像 、 位 置 、 数 据 
连接 等 等 -- 它们 的 多 数 可 以 通过 组 合 和 抽象 的 手段 来 定义 ， 我 们 在 这 一 章 会 研究 它们 。 
Python 只 有 一 小 部 分 内 建 于 语言 的 原始 或 原生 数据 类 型 。 


原始 数据 类 型 具有 以 下 特性 : 


1， 原 始 表达 式 可 以 计算 这 些 类 型 的 对 象 ， 叫 做 字面 值 。 
2.， 内 建 的 函数 、 运 算 符 和 方法 可 以 操作 这 些 对 象 。 


像 我 们 看 到 的 那样 ， 数 值 是 原始 类 型 ， 数 字 字 面值 求 值 为 数值 ， 算 术 运 算 符 操作 数值 对 象 : 


>>> 12 + 3000000000000000000000000 
3000000000000000000000012 


实际 上 ，Python 包含 了 三 个 原始 数值 类 型 : 整数 ( int ) 、 实 数 〈 float ) 和 复数 
( complex ) 


>>> type(2) 
<class 'int'> 
>>> type(1.5) 
<class 'float'> 
>>> type(1+1j) 
<class 'complex'> 


名 称 float 来 源 于 实数 在 Python 中 表示 的 方式 :“ 浮 点 "表示 。 虽 然 数 值 表 示 的 细节 不 是 这 门 
课 的 话题 ， 一 些 int 和 float 对 象 的 高 层 差异 仍然 很 重要 。 特 别 是 ， int 对 象 只 能 表示 整 
数 ， 但 是 表示 得 更 精确 ， 不 带 有 任何 近似 。 另 一 方面 ， float 对 象 可 以 表示 很 大 范围 内 的 分 
数 ， 但 是 不 能 表示 所 有 有 理 数 。 然 而 ， 浮 点 对 象 通常 用 于 近似 表示 实数 和 有 理 数 ， 全 入 到 某 
个 有 效 数 字 的 数值 。 


扩展 阅读 。 下 面 的 章节 介绍 了 更 多 的 Python 原始 数据 类 型 ， 专 注 于 它们 在 创建 实用 数据 抽象 
中 的 作用 。Dive Into Python 3 中 的 原始 数据 类 型 一 章 提供 了 所 有 Python 数据 类 型 的 实用 概 
览 ， 以 及 如 何 高 效 使 用 它们 ， 还 包含 了 许多 使 用 示例 和 实践 提示 。 你 现在 并 不 需要 阅读 它 ， 
但 是 要 考虑 将 它 作为 宝贵 的 参考 。 


2.2 数据 抽 因 


来 源 : 2.2 Data Abstraction 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


由 于 我 们 希望 在 程序 中 表达 世界 中 的 大 量 事物 ， 我 们 发 现 它们 的 大 多 数 都 具有 复合 结构 。 日 
期 是 年 月 日 ， 地 理 位 置 是 精度 和 纬度 。 为 了 表示 位 置 ， 我 们 希望 程 序 语言 具有 将 精度 和 续 
度 “ 粘 合 ” 为 一 对 数据 的 能 力 -- 也 就 是 一 个 复合 数据 结构 -- 使 我 们 的 程序 能 够 以 一 种 方式 操作 
数据 ， 将 位 置 看 做 单个 概念 单元 ， 它 拥有 两 个 部 分 。 


复合 数据 的 使 用 也 让 我 们 增加 程序 的 模块 性 。 如 果 我 们 可 以 直接 将 地 理 位 置 看 做 对 象 来 操 
作 ， 我 们 就 可 以 将 程序 的 各 个 部 分 分 离 ， 它 们 根据 这 些 值 如 何 表示 来 从 本 质 上 处 理 这 些 值 。 
将 某 个 部 分 从 程序 中 分 离 的 一 般 技 巧 是 一 种 叫做 数据 抽 旬 的 强大 的 设计 方法 论 。 这 个 部 分 用 
于 处 理 数 据 表 示 ， 而 程序 用 于 操作 数据 。 数 据 抽 象 使 程序 更 易于 设计 、 维 护 和 修改 。 


数据 抽象 的 特征 类 似 于 函数 抽象 。 当 我 们 创建 函数 抽象 时 ， 函 数 如 何 实现 的 细节 被 隐藏 了 ， 
而 且 特定 的 函数 本 身 可 以 被 任何 具有 相同 行为 的 函数 替换 。 换 句 话 说， 我 们 可 以 构造 抽象 来 
使 函数 的 使 用 方式 和 函数 的 实现 细节 分 离 。 与 之 相似 ， 数 据 抽象 是 一 种 方法 论 ， 使 我 们 将 复 
合 数据 对 象 的 使 用 细节 与 它 的 构造 方式 隔离 。 


数据 抽象 的 基本 概念 是 构造 操作 抽象 数据 的 程序 。 也 就 是 说 ， 我 们 的 程序 应 该 以 一 种 方式 来 
使 用 数据 ， 对 数据 做 出 尽 可 能 少 的 假设 。 同时， 需要 定义 具体 的 数据 表示 ， 独 立 于 使 用 数据 
的 程序 。 我 们 系统 中 这 两 部 分 的 接口 是 一 系列 函数 ， 叫 做 选择 器 和 构造 器 ， 它 们 基于 具体 表 
示 实 现 了 抽象 数据 。 为 了 演示 这 个 技巧 ， 我 们 需要 考虑 如 何 设计 一 系列 函数 来 操作 有 理 数 。 


当 你 阅读 下 一 节 时 ， 要 记 住 当今 编写 的 多 数 Python 代码 使 用 了 非常 高 级 的 抽象 数据 类 型 ， 它 
们 内 建 于 语言 中 ， 比 如 类 、 字 典 和 列表 。 由 于 我 们 正在 了 解 这 些 抽象 的 工作 原理 ， 我 们 自己 
不 能 使 用 它们 。 所 以 ， 我 们 会 编写 一 些 不 那么 Python 化 的 代码 -- 它 并 不 是 在 语言 中 实现 我 们 
的 概念 的 通常 方式 。 但 是 ， 我 们 所 编写 的 代码 出 于 教育 目的 ， 它 展示 了 这 些 抽 象 如 何 构建 。 
要 记 住 计算 机 科学 并 不 只 是 学 习 如 何 使 用 编程 语言 ， 也 学 习 它 们 的 工作 原理 。 


2 2 1 示例 : 有 理 数 的 算 


有 理 数 可 表示 为 整数 的 比值 ， 并 且 它 组 成 了 实数 的 一 个 重要 子 类 。 类 似 于 1/3 或 者 17/29 的 
有 理 数 通常 可 编写 为 : 


<numerator>/<denominator> 


其 中 ” <numerator> 和 <denominator> 都 是 值 为 整数 的 占 位 符 。 有 理 数 的 值 需 要 两 部 分 来 描 
述 。 


有 理 数 在 计算 机 科学 中 很 重要 ， 因 为 它们 就 像 整 数 那样 ， 可 以 准确 表示 。 无 理 数 (比如 pi 
或 者 e 或 者 sqrt(2) ) 会 使 用 有 限 的 二 元 展开 代替 为 近似 值 。 所 以 在 原则 上 “， 有 理 数 的 处 
理应 该 让 我 们 避免 算术 中 的 近似 误差 。 


但 是 ,一旦 我 们 昌 正 将 分 子 与 分 母 相 除 ， 我 们 就 会 只 剩 下 截断 的 小 数 近 似 值 


>>> 1/3 
0.3333333333333333 


当 我 们 开始 执行 测试 时 ， 这 个 近似 值 的 问题 就 会 出 现 : 


>>> 1/3 == 0.333333333333333300000 # Beware of approximations 
Te 


ds 
有 理 数 表示 为 整数 的 比值 ， 我 们 能 够 完全 避免 近似 问题 。 所 以 出 于 精确 ， 我 们 希望 将 分 
i 


我 们 从 函数 抽象 中 了 解 到 ， 我 们 可 以 在 了 解 菜 些 部 分 的 实现 之 前 开始 编 出 东西 来 。 让 我 们 一 
开始 假设 我 们 已 经 拥有 一 种 从 分 子 和 分 母 中 构造 有 理 数 的 方式 。 a 
数 ， 我 们 都 有 办 法 来 提取 (或 选中 ) 它 的 分 子 和 分 母 。 让 我 们 进一步 假设 ， 构 造 器 和 选择 
以 下 面 三 个 函数 来 提供 : 


e make_rat(n, d) 返回 分 子 为 n 和 分 母 为 d 的 有 理 数 。 
e numer(x) 返回 有 理 数 x 的 分 子 。 
e denom(x) 返回 有 理 数 x 的 分 母 


我 们 在 这 里 正在 使 用 一 个 强大 的 合成 策略 : 心 想 事 成 。 我 们 并 没有 说 有 理 数 如 何 表示 ， 或 
者 numer 、 denom 和 make_rat 如 何 实现 。 即 使 这 样 ， 如 果 我 们 拥有 了 这 三 个 函数 ， 我 们 就 可 
以 执行 加 法 、 乘 法 ， 以 及 测试 有 理 数 的 相等 性 ， 通 过 调用 它们 : 


>>> 汪 de agodggcat(XxaVE 

nx, dx = numer(x), denom(x) 

ny, dy = numer(y), denom(y) 

return make_rat(nx * dy + ny * dx, dx * dy) 
>>>>defmudlerat(x Vy): 

return make_rat(numer(x) * numer(y), denom(x) * denom(y)) 
>>>>°defredqrnat(xX Vv): 

return numer(x) * denom(y) == numer(y) * denom(x) 


现在 我 们 拥有 了 由 选择 器 函数 numer 和 denom ， 以 及 构造 器 函数 make_rat 定义 的 有 理 数 操 
作 。 但 是 我 们 还 没有 定义 这 些 函 数 。 我 们 需要 以 某 种 方式 来 将 分 子 和 分 母 粘 合 为 一 个 单元 。 


元 组 的 元 素 可 以 由 两 种 方式 解构 。 第 一 种 是 我 们 熟悉 的 多 重 赋值 : 


>>> pair = (1, 2) 
>>> pair 

(1, 2) 

>>> x, y = pair 
SS>°X 


>>> y 


实际 上 ， 多 重 赋值 的 本 质 是 创建 和 解构 元 组 。 
访问 元 组 元 素 的 第 二 种 方式 是 通过 下 标 运 算 符 ， 写 作 方 括号 : 


>>> pair[0] 
3 


>>> pair[1] 
2 


Python 中 的 元 组 (以 及 多 数 其 它 编 程 语言 中 的 序列 ) 下 标 都 以 0 开始 ， 也 就 是 说 ， 下 标 0 表 
示 第 一 个 元 素 ， 下 标 1 表示 第 二 个 元 素 ， 以 此 类 推 。 我 们 对 这 个 下 标 惯例 的 直觉 是 ， 下 标 表 
示 一 个 元 素 距 离 元 组 开头 有 多 远 


与 元 素 选 择 操作 等 价 的 函数 叫做 getitem ， 它 也 使 用 下 标 以 0 开始 的 位 置 来 在 元 组 中 选择 元 


元 素 是 原始 类 型 ， 也 就 是 说 Python 的 内 建 运算 符 可 以 操作 它们 。 我 们 不 久之 后 再 来 看 元 素 的 
完整 特性 。 现 在 ， 我 们 只 对 元 组 如 何 作为 胶水 来 实现 抽象 数据 类 型 感 兴趣 。 


nn 元 素 提 供 了 一 个 自然 的 方式 来 将 有 理 数 实现 为 一 对 整数 : 分 子 和 分 母 。 我 们 可 
过 操作 二 元 组 来 实现 我 们 的 有 理 数 构造 器 和 选择 器 函数 。 


>>>>def makearat(na dys 
return (n, d) 
>>> def numer(x): 
return getitem(x, 0) 
>>> def denom(x): 
return getitem(x, 1) 


用 于 打印 有 理 数 的 骂 数 完成 了 我 们 对 抽象 数据 结构 的 实现 。 


>>> def str_rat(x): 
”Returnma seringm nd ior numerator nand denomanator oe 
return '{0}/{1}'.format(numer(x), denom(x)) 


将 它 与 我 们 之 前 定义 的 算术 运 莫 放 在 一 起 ， 我 们 可 以 使 用 我 们 定义 的 子 数 来 操作 有 理 数 了 。 


>>> half = make_rat(1, 2) 

>>> str_rat(half) 

2 

>>> third = make_rat(1, 3) 

>>> str_rat(mul rat(half, third)) 
AO 

>>> str_rat(add_rat(third, third)) 
GNA9. 


就 像 最 后 的 例子 所 展示 的 那样 ， 我 们 的 有 理 数 实现 并 没有 将 有 理 数 化 为 最 简 。 我 们 可 以 通过 
修改 make_rat 来 补救 。 如 果 我 们 拥有 用 于 计算 两 个 整数 的 最 大 公约 数 的 函数 ， 我 们 可 以 在 构 
造 一 对 整数 之 前 将 分 子 和 分 母 化 为 最 简 。 这 可 以 使 用 许多 实用 工具 ， 例 如 Python 库 中 的 现存 


>>> from fractions import gcd 
>>> def make_rat(n, d): 

g = gcd(n, d) 

return (n//g, d//g) 


双 斜 杠 运算 符 // 表示 整数 除法 ， 它 会 向 下 取 整 除法 结果 的 小 数 部 分 。 由 于 我 们 知道 g 能 整 
除 n 和 d， 整 数 除 法 正好 适用 于 这 里 。 现 在 我 们 的 


>>> str_rat(add_rat(third, third)) 
2 


符合 要 求 。 这 个 修改 只 通过 修改 构造 器 来 完成 ， 并 没有 修改 任何 实现 实际 算术 运算 的 函数 。 


扩展 阅读 上 面 的 str_rat 实现 使 用 了 格式 化 字符 串 2 它 包含 了 值 的 占 位 符 全 如 何 使 用 格式 
化 字符 串 和 format 方法 的 细节 请 见 Dive Into Python 3 的 格式 化 字符 串 一 节 。 


2.2.3 抽象 界限 


在 以 更 多 复合 数据 和 数据 抽象 的 例子 继续 之 前 ， 让 我 们 思考 一 些 由 有 理 数 示例 产生 的 问题 。 
我 们 使 用 构造 器 make_rat 和 选择 器 numer 和 denom 定义 了 操作 。 通 常 ， 数 据 抽 象 的 底层 概念 
是 ， 基 于 某 个 值 的 类 型 的 操作 如 何 表达 ， 为 这 个 值 的 类 型 确定 一 组 基本 的 操作 。 之 后 使 用 这 
些 操作 来 操作 数据 。 


我 们 可 以 将 有 理 数 系统 想象 为 一 系列 层级 。 


Rational numbers In the problem domain 





add_rat mul_rat eq_rat | 


Rational numbers as numerators & denominators 











make_rat numer denom 


Rational numbers as tuples 











tuple getitem | 


However tuples are implemented in Python 


平行 线 表示 隔离 系统 不 同 层级 的 界限 。 每 一 层 上 ， 界 限 分 离 了 使 用 数据 抽象 的 函数 (上面 ) 

和 实现 数据 抽象 的 济 数 (下面) 。 使 用 有 理 数 的 程序 仅仅 通过 莫 术 函数 来 操作 它 

们 : add_rat 、mul_rat 和 eq_rat 。 相 应 地 ， 这 些 函 数 仅 仅 由 构造 器 和 选择 

器 make_rat 、 numer 和 and denom 来 实现 ， 它 们 本 身 由 元 组 实现 。 元 组 如 何 实现 的 字 节 和 其 
它 层 级 没有 关系 ， 只 要 元 组 支持 选择 器 和 构造 器 的 实现 。 


每 一 层 上 ， 盒 子 中 的 a ， 因 为 它们 仅仅 依赖 于 上 层 的 表现 (通过 使 
用 ) 和 底层 的 实现 (通过 定义 ) 。 这 样 ， 抽 象 界 限 可 以 表现 为 一 系列 函数 。 


抽象 界限 具有 许多 好 处 。 一 个 好 处 就 是 ， 它 们 使 程序 更 易于 维护 和 修改 。 很 少 的 函数 依赖 于 
特定 的 表现 ， 当 一 个 人 希望 修改 表现 时 ， 不 需要 做 很 多 修改 。 


2.2.4 数据 属性 


我 们 通过 实现 算术 运算 来 开始 实现 有 理 数 ， 实 现 为 这 三 个 非特 定 函 
数 : make_rat 、 numer 和 denom 。 这 里 ， 我 们 可 以 认为 已 经 定义 了 数据 对 象 -- 分 子 、 分 母 
和 有 理 数 -- 上 的 运算 ， 它 们 的 行为 由 这 三 个 函数 规定 。 


i le ? 我们 还 不 能 说 “提供 的 选择 器 和 构造 器 实现 了 任何 东西 "。 我 们 需要 保证 
些 函 数 一 ne 。 也 就 是 说 ， 如 果 我 们 从 整数 n 和 d 中 构造 了 有 理 数 x ， 
么 numer(x)/denom(x) 应 该 等 于 n/d 。 


这 这 
长 


通常 ， 我 们 可 以 将 抽象 数据 类 型 当做 一 些 选择 器 和 构造 器 的 集合 ， 并 带 有 一 些 行为 条 件 。 只 
要 满足 了 行为 条 件 (比如 上 面 的 除法 特性 ) ， 这 些 函 数 就 组 成 了 数据 类 型 的 有 效 表 示 。 


这 个 观点 可 以 用 在 其 他 数据 类 型 上 ， 例 如 我 们 为 实现 有 理 数 而 使 用 的 二 元 组 。 我 们 实际 上 不 
会 谈论 元 组 是 什么 ， 而 是 谈论 由 语言 提供 的 ， 用 于 操作 和 创建 元 组 的 运算 符 。 我 们 现在 可 以 


描述 二 元 组 的 行为 条 件 ， 二 元 组 通常 叫做 偶 对 ， 在 表示 有 理 数 的 问题 中 有 所 涉及 。 
为 了 实现 有 理 数 ， 我 们 需要 一 种 两 个 整数 的 粘 合 形式 ， 它 具有 下 列 行为 


e 如 果 一 个 偶 对 p 由 x 和 y a ， 那么 getitem_pair(p，6) 返 
回 x ， getitem_pair(p，1) 返回 y 。 


我 们 可 以 实现 make_pair 和 getitem pair ， 它 们 和 元 组 一 样 满足 这 个 描述 : 


>>> def make pair(x, y): 
”Return a function that behaves like a pair.""" 
def dispatch(m): 
if m == 0: 
return x 
elif m == 1: 
metunmnmney 
return dispatch 
>>>"deftngqetrtempanr (pa 
”Return the element at index 1 of pair pp 
return p(i) 


使 用 这 个 实现 ， 我 们 可 以 创建 和 操作 偶 对 : 


>>> p = make_pair(1, 2) 
>>> getitem pair(p, 9) 
3 
>>> getitem pair(p, 1) 
公 


这 个 函数 的 用 法 不 同 于 任何 直观 上 的 ， 数 据 应 该 是 什么 的 概念 。 而 且 ， 数 满足 于 在 我 
们 的 程序 中 表示 复合 数据 。 


需要 注意 的 微妙 的 一 点 是 ， 由 make_pair 返回 的 值 是 叫做 dispatch 的 函数 ， 它 接受 参数 m 并 
返回 x 或 y 。 之 后 ，getitem pair 调用 了 这 个 函数 来 获取 合适 的 值 。 我 们 在 这 一 章 中 会 多 
次 返回 这 个 调度 函数 的 话题 。 


这 个 偶 对 的 函数 表示 并 不 是 Python 实际 的 工作 机 制 (元 组 实现 得 更 直接 ， 出 于 性 能 因素 ) ， 
但 是 它 可 以 以 这 种 方式 工作 。 这 个 函数 表示 虽然 不 是 很 明显 ， 但 是 是 一 种 足够 完美 来 表示 偶 
对 的 方式 ， 因 为 它 满 足 了 偶 对 唯一 需要 满足 的 条 件 。 这 个 例子 也 表明 ， 将 函数 当做 值 来 操作 
的 能 力 ， 提 供给 我 们 表示 复合 数据 的 能 力 。 


2.3 厅 列 


来 源 : 2.3 Sequences 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


序列 是 数据 值 的 顺序 容器 。 不 像 偶 对 只 有 两 个 元 素 ， 序 列 可 以 拥有 任意 (但 是 有 限 ) 个 有 序 


序列 在 计算 机 科学 中 是 强大 而 基本 的 抽象 。 例 如 ， 如 果 我 们 使 用 序列 ， 我 们 就 可 以 列 出 伯 克 
利 的 每 个 学 生 ， 或 者 世界 上 的 每 所 大 学 ， 或 者 每 所 大 学 中 的 每 个 学 生 。 我 们 可 以 列 出 上 过 的 
每 一 门 课 ， 提 交 的 每 个 作业 ， 或 者 得 到 的 每 个 成 绩 。 序 列 抽象 让 数 千 个 数据 驱动 的 程序 影响 
着 我 们 每 天 的 生活 。 


序列 不 是 特定 的 抽象 数据 类 型 ， 而 是 不 同类 型 共有 的 一 组 行为 。 也 就 是 说 ， 它 们 是 许多 序列 
种 类 ， 但 是 都 有 一 定 的 属性 。 特 别 地 ， 


长 度 。 序 列 拥有 有 限 的 长 度 。 


元 素 选择 。 序 列 的 每 个 元 素 都 拥有 相应 的 非 负 整数 作为 下 标 ， 它 小 于 序列 长 度 ， 以 第 一 个 元 
素 的 0 开始 。 


不 像 抽象 数据 类 型 ， 我 们 并 没有 阐述 如 何 构 造 序列 。 序 列 抽象 是 一 组 行为 ， 它 们 并 没有 完全 
指定 类 型 (例如 ， 使 用 构造 器 和 选择 器 ) ， 但 是 可 以 在 多 种 类 型 中 共享 。 序 列 提供 了 一 个 抽 
象 层 级 ， 将 特定 程序 如 何 操作 序列 类 型 的 细节 隐藏 。 


这 一 节 中 ， 我 们 开发 了 一 个 特定 的 抽象 数据 类 型 ， 它 可 以 实现 序列 抽象 。 我 们 之 后 介绍 实现 
相同 抽象 的 Python 内 建 类 型 。 


2.3.1 葡 套 偶 对 


对 于 有 理 数 ， 我 们 使 用 二 元 组 将 两 个 整数 对 象 配对 ， 之 后 展示 了 我 们 可 以 同样 通过 函数 来 实 
现 偶 对 。 这 种 情况 下 ， 每 个 我 们 构造 的 偶 对 的 元 素 都 是 整数 。 然 而 ， 就 像 表达 式 ， 元 组 可 以 
肯 套 。 每 个 偶 对 的 元 素 本 身 也 可 以 是 偶 对 ， 这 个 特性 在 实现 偶 对 的 任意 一 个 方法 ， 元 组 或 调 
度 函 数 中 都 有 效 。 


可 视 化 偶 对 的 一 个 标准 方法 -- 这 里 也 就 是 偶 对 (1,2) -- 叫做 盒子 和 指针 记号 。 每 个 值 ， 复 合 
或 原始 ， 都 描述 为 指向 盒子 的 指针 。 原 始 值 的 盒子 只 包含 那个 值 的 表示 。 例 如 ， 数 值 的 盒子 


只 包含 数字 。 偶 对 的 使 子 实际 上 是 两 个 金子 : 左边 的 部 分 (箭头 指向 的 ) 包含 偶 对 的 第 一 个 
元 素 右边 的 部 分 包含 第 二 ~° 


| 


瞪 套 元 素 的 Python 表达 式 : 


>>>°"((T 2) (374)) 
((1, 2), (3, 4)) 


具有 下 面 的 结构 : 








使 用 元 组 作为 其 它 元 组 元 素 的 能 力 ， 提 供 了 我 们 编程 语言 中 的 一 个 新 的 组 合 手段 。 我 们 将 这 
种 将 元 组 以 这 种 方式 虞 套 的 能 力 叫 做 元 组 数据 类 型 的 封闭 性 。 通 常 ， 如 果 组 合 结果 自己 可 以 
使 用 相同 的 方式 组 合 ， 组 合 数据 值 的 方式 就 满足 封闭 性 。 封 闭 性 在 任何 组 合 手段 中 都 是 核心 
能 力 ， 因 为 它 允许 我 们 创建 层次 数据 结构 -- 结构 由 多 个 部 分 组 成 ， 它 们 自己 也 由 多 个 部 分 组 
成 ， 以 此 类 推 。 我 们 在 第 三 章 会 探索 一 些 层次 结构 。 现 在 ， 我 们 考虑 一 个 特定 的 重要 结构 。 


2.3.2 递归 列表 


我 们 可 以 使 用 诅 套 偶 对 来 构建 任意 长 度 的 元 素 列表 ， 它 让 我 们 能 够 实现 抽象 序列 。 下 面 的 图 
展示 了 四 元 素 列 表 1，2，3，4 的 递归 表示 : 


一 HH- 























这 个 列表 由 一 系列 偶 对 表示 。 每 个 偶 对 的 第 一 个 元 素 是 列表 中 的 元 素 ， 而 第 二 个 元 素 是 用 于 
表示 列表 其 余部 分 的 偶 对 。 最 后 一 个 偶 对 的 第 二 个 元 素 是 None ， 它 表明 列表 到 末尾 了 。 我 们 
可 以 使 用 玄 套 的 元 组 字面 值 来 构造 这 个 结构 : 


>>> (1, (2, (3, (4, None)))) 
(1, (2, (3, (4, None)))) 


ja 结构 通常 对 应 了 一 种 非常 实用 的 序列 思考 方式 ， 我 们 在 Python 解释 器 的 执行 规则 
中 已 经 见 过 它 了 。 一 个 非 空 序列 可 以 划分 为 : 


。 它 的 第 一 个 元 素 ， 以 及 
。 序列 的 其 余部 分 


序列 的 其 余部 分 本 身 就 是 一 个 〈 可 能 为 空 的 ) 序列 。 我 们 将 序列 的 这 种 看 法 叫做 递归 ， 因 为 
序列 包含 其 它 序列 作为 第 二 个 组 成 部 分 


由 于 我 们 的 列表 表示 是 递归 的 ， 我 们 在 实现 中 叫 它 rlist ， 以 便 不 会 和 Python 内 建 
的 list 类 型 混淆 ， 我 们 会 稍 后 在 这 一 章 介 绍 它 。 一 个 递归 列表 可 以 由 第 一 个 元 素 和 列表 的 剩 
余部 分 构造 。 None 值 表示 空 的 递归 列表 。 


>>> empty_rlist = None 

>>> def make rilist(first, rest): 
"""Make a recursive list from its first element and the rest.""" 
return (first, rest) 

>>> def first(s): 
"""Return the first element of a recursive list s.""" 
return S[0] 

>>>° def rest(s): 
"""Return the rest of the elements of a recursive list s.""" 
return Ss[1] 


这 两 个 选择 器 和 一 个 构造 器 ， 以 及 一 个 常量 共同 实现 了 抽象 数据 类 型 的 递归 列表 。 递 归 列 表 
唯一 的 行为 条 件 是 ， 就 像 偶 对 那样 ， 它 的 构造 器 和 选择 器 是 相反 的 函数 。 


e。 如 果 一 个 递归 列表 s 由 元 素 f 和 列表 r 构造 ， 那 么 first(s) 返回 f， 并 且 rest(s) 返 
可 症 轩 ” 


我 们 可 以 使 用 构造 器 和 选择 器 来 操作 递归 列表 。 
>>> counts = make_rlist(1, make_rlist(2, make_rlist(3, make_rlist(4, empty_rilist)))) 
>>> first(counts) 


>>> rest(counts) 
(2, (3, (4, None))) 


递归 列表 可 以 按 序 储存 元 素 序列 ， 但 是 它 还 没有 实现 序列 的 抽象 。 使 用 我 们 已 经 定义 的 数据 
类 型 抽象 ， 我 们 就 可 以 实现 描述 两 个 序列 的 行为 : 长 度 和 元 素 选择 。 


之 >> 重 den 可 DIS (SI 
RecunithnesiengnEoftrecucsIVelmstSR 
length = 0 
while s != empty_rlist: 
s, length = rest(s), length + 1 
return length 
>>>>defmgoetrueemnmm ius 
-Retunnm tne element at ndex a ofrecursiVve LTSse So 
whmle® > 0 
Ss 7 rest(s) 1 1 
return first(s) 


现在 ， 我 们 可 以 将 递归 列表 用 作 序 列 了 : 


>>> len_rlist(counts) 
4 


>>> getitem rlist(counts, 1) # The second item has index 1 
2 


两 个 实现 都 是 可 迭代 的 。 它 们 隔离 了 嵌 套 偶 对 的 每 个 层级 ， 直 到 列表 的 末尾 
(在 len_rlist 中 ) 3 或 者 到 达 了 想 要 的 元 素 (在 getitem rilist 中 ) 9 


下 面 的 一 系列 环境 图 示 展 示 了 和 迭代 过 程 ， getitem_rlist 通过 它 找到 了 递归 列表 中 下 标 1 中 
的 元 素 2 。 


Tinsts 


rest: 










getitem_rlist getitem_rlist(counts, 1) 


: P> while i > 0: 
Su Se 3 Pestlis})y 1 1 
| return first(i) 





while 头 部 中 的 表达 式 求 值 为 夏 ， 这 会 导致 while 语句 组 中 的 赋值 语句 被 执行 : 


2S 谨 列 



















getitem_rlist getitem_rlist(counts, 1) 





: while i > 0: 
“oy 5 4= rest(ts}s = 1 
T return first(i) 


这 里 ， 局 部 名 称 s 现在 指向 以 原 列表 第 二 个 元 素 开始 的 子 列表 。 现 在 ，while 头 中 的 表达 式 


求 值 为 假 ， 于 是 Python 会 求 出 getitem_rlist 最 后 一 行 中 返回 语句 中 的 表达 式 。 


ips 


rest: 






getitem_rlist(counts, 1) 

: while i > 0: 

…(e】 s, 41= rest(s}), 4=1 

T b> return: first(s) 
1 





wm 
机 
二 本 


tirstts) 


ee (e) return s[0] 


最 后 的 环境 图 ee first 的 局 部 帧 ， 它 包含 绑 定 到 相同 子 列表 的 s 。 first 函数 挑 
选 出 值 2 并 返 ， 完 成 了 getitem rlist 的 调用 。 
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这 个 例子 演示 了 递归 列表 计算 的 常见 模式 ， 其 中 和 迭代 的 每 一 步 都 操作 原 列 表 的 一 个 逐渐 变 短 
的 后 缓 。 寻 找 递 归 列 表 的 长 度 和 元 素 的 渐进 式 处 理 过 程 需要 一 些 时 间 来 计算 。 (第 三 章 中 ， 
我 们 会 学 会 描述 这 种 函数 的 计算 时 间 。) Python 的 内 建 序列 类 型 以 不 同方 式 实现 ， 它 对 于 计 
算 序 列 长 度 和 获取 元 素 并 不 具有 大 量 的 计算 开销 。 


2.3.2 元 组 1 


实际 上 ， 我 们 引入 用 于 形成 原始 偶 对 的 tuple 类 型 本 身 就 是 完整 的 序列 类 型 。 元 组 比 起 我 们 
以 函数 式 实 现 的 偶 对 抽象 数据 结构 ， 本 质 上 提供 了 更 多 功能 。 


元 组 具有 任意 的 长 度 ， 并 且 也 拥有 序列 抽象 的 两 个 基本 行为 : 长 度 和 元 素 选择 。 下 面 
的 digits 是 一 个 四 元 素 元 组 。 


S355°diolts (1 e238) 
>>> len(digits) 

4 

>>> digits[3] 

8 


此 外 ， 元 素 可 以 彼此 相 加 以 及 与 整数 相 乘 。 对 于 元 组 ， 加 法 和 乘法 操作 并 不 对 元 素 相 加 或 相 
乘 ， 而 是 组 合 和 重复 元 组 本 身 。 也 就 是 说 ， operator 模块 中 的 add 函数 (以 及 + 运算 符 ) 
返回 两 个 被 加 参数 连接 成 的 新 元 组 。 operator 模块 中 的 mul 函数 (以 及 * 运算 符 ) 接受 整 
数 k 和 元 组 ， 并 返回 含有 元 组 参数 k 个 副本 的 新 元 组 。 


>>>°(2.7) rt dnonts 2 
(2 TS 2 2 


映射 。 将 一 个 元 组 变换 为 另 一 个 元 组 的 强大 手段 是 在 每 个 元 素 上 调用 函数 ， 并 收集 结果 。 这 
一 计算 的 常用 形式 叫做 在 序列 上 映射 函数 ， 对 应 内 建 函 数 map 。 map 的 结果 是 一 个 本 身 不 是 
序列 的 对 象 ， 但 是 可 以 通过 调用 tuple 来 转换 为 序列 。 它 是 元 组 的 构造 器 。 


Slalternates = (1 2 30408) 
>>> tuple(map(abs, alternates)) 
(2 


map 函数 非常 重要 ， 因 为 它 依赖 于 序列 抽象 : 我 们 不 需要 关心 底层 元 组 的 结构 ， 只 需要 能 够 
独立 访问 每 个 元 素 ， 以 便 将 它 作为 参数 传 入 用 于 映射 的 函数 中 《这 里 是 abs ) 。 


2.3.4 厅 列 迭代 


映射 本 身 就 是 通用 计算 模式 的 一 个 实例 : 在 序列 中 选 MA 为 了 在 序列 上 映射 函数 ， 
我 们 不 仅仅 需要 选择 特定 的 元 素 ， 还 要 依次 选择 每 个 元 素 。 这 个 模式 非常 普遍 ，Python 拥有 
额外 的 控制 语句 来 处 理 序 列 数据 : for 语句 。 


考虑 一 个 问题 ， 计 算 一 个 值 在 序列 中 出 现 了 多 少 次 。 我 们 可 以 使 用 while 循环 实现 一 个 函数 
来 计算 这 个 数量 。 


>>> def count(s, value): 
”Count the number of occurrences of Value in sequence Ss.""" 
total, index = 0, 0 
while index < len(s): 
if s[index] == value: 
total = total + 1 
index = index + 1 
return total 
>>> count(digits, 8) 
到 


Python for 语句 可 以 通过 直接 和 迭代 元 素 值 来 简化 这 个 也 数 体 ， 完 全 不 需要 引入 index 。 例 如 
(原文 是 For example ， 为 双关 语 ) ， 我 们 可 以 写成 : 


>>> def count(s, value): 
”Count the number of occurrences of Value in sequence Ss.""" 
total = 0 
forelem ns 
if elem == value: 
total = total + 1 
return total 
>>> count(digits, 8) 


for 语句 按照 以 下 过 程 来 执行 : 


. 求 出 头 部 表达 式 <expression> ， 它 必须 产生 一 个 可 和 迭代 的 值 。 
ee 按 顺序 : 
i， 在 局 部 环境 中 将 变量 名 <name> 绑 定 到 这 个 值 上 。 
ii， 执 行 语 名 组 <suite> 。 


步骤 1 引用 了 可 和 迭代 的 值 。 序 列 是 可 和 迭代 的 ， 它 们 的 元 素 可 看 做 迭代 的 顺序 。Python 的 确 拥 
有 其 他 可 和 迭代 类 型 ， 但 是 我 们 现在 只 关注 序列 。 术 语 “ 可 迭代 对 象 " 的 一 般 定 义 会 在 第 四 章 的 和 迭 
代 器 一 节 中 出 现 。 


这 个 求 值 过 程 的 一 个 重要 结果 是 ， 在 for 语句 执行 完毕 之 后 ， <name> 会 绑 定 到 序列 的 最 后 一 
个 元 素 上 。 这 个 for 循环 引入 了 另 一 种 方式 ， 其 中 局 部 环境 可 以 由 语句 来 更 新 。 


序列 解构 。 程 序 中 的 一 个 常见 模式 是 ， 序 列 的 元 素 本 身 就 是 序列 ， 但 是 具有 国定 的 长 
度 。 for 语句 可 在 头 部 中 包含 多 个 名 称 ， 将 每 个 元 素 序 列 “ 解 构 ” 为 各 个 元 素 。 例 如 ， 我 们 拥有 
一 个 偶 对 (也 就 是 二 元 组 ) 的 序列 : 


>>> pairs = ((1, 2), (2, 2), (2, 3), (4, 4)) 


下 面 的 for 语句 的 头 部 带 有 两 个 名 词 ， 会 将 每 个 名 称 x 和 y 分 别 绑 定 到 每 个 偶 对 的 第 一 个 
和 第 二 个 元 素 上 。 


>>> for x, y in pairs: 
If x == y: 
same_count = same count + 1 
>>> Same_count 
2 


这 个 绑 定 多 个 名 称 到 定 长 序列 中 多 个 值 的 模式 ， 叫 做 序列 解构 。 它 的 模式 和 我 们 在 赋值 语句 
中 看 到 的 ， 将 多 个 名 称 绑 定 到 多 个 值 的 模式 相同 。 


范围 。 range 是 另 一 种 Python 的 内 建 序列 类 型 ， 它 表示 一 个 整数 范围 。 范 围 可 以 使 
用 range 函数 来 创建 ， 它 接受 两 个 整数 参数 : 所 得 范围 的 第 一 个 数值 和 最 后 一 个 数值 加 一 9 


>>> range(1, 10) # Includes 1, but not 10 
range(1, 10) 


在 范围 上 调用 tuple 构造 器 会 创建 与 范围 具有 相同 元 素 的 元 组 ， 使 元 素 易 于 查看 。 


>>> tuple(range(5, 8)) 
(S57 0 


如 果 只 提供 了 一 个 元 素 ， 它 会 解释 为 最 后 一 个 数值 加 一 ， 范 围 开始 于 0。 


>>> total = 0 

>>> for k in range(5, 8): 
total = total + k 

>>> total 

18 


常见 的 惯例 是 将 单 下 划 线 字符 用 于 for 头 部 ， 如 果 这 个 名 称 在 语句 组 中 不 会 使 用 。 
>>> for _ in range(3): 
print('Go Bears!') 
Go Bears! 


Go Bears! 
Go Bears! 


要 注意 对 解释 器 来 说 ， 下 划 线 只 是 另 一 个 名 称 ， 但 是 在 程序 员 中 具有 固定 含义 ， 它 表明 这 个 
名 称 不 应 出 现在 任何 表达 式 中 。 


2.3.5 厅 列 抽象 


我 们 已 经 介绍 了 两 种 原生 数据 类 型 ， 它 们 实现 了 序列 抽象 : 元 组 和 范围 。 两 个 都 满足 这 一 章 
开始 时 的 条 件 : 长 度 和 元 素 选择 。Python 还 包含 了 两 种 序列 类 型 的 行为 ， 它 们 扩展 了 序列 抽 
象 。 


成 员 性 。 可 以 测试 一 个 值 在 序列 中 的 成 员 性 。Python 拥有 两 个 操作 符 in 和 not in ， 取 决 于 
元 素 是 否 在 序列 中 出 现 而 求 值 为 True 和 False 。 


>>> digits 

(L198 2908) 

>>> 2 in digits 

maue 

>>> 1828 not in digits 
avue 


所 有 序列 都 有 叫做 index 和 count 的 方法 ， 它 会 返回 序列 中 茶 个 值 的 下 标 ( 或 者 数量 ) 。 


切片 。 序 列 包 含 其 中 的 子 序列 。 我 们 在 开发 我 们 的 谋 套 偶 对 实现 时 观察 到 了 这 一 点 ， 它 将 序 
列 切 分 为 它 的 第 一 个 元 素 和 其 余部 分 。 序 列 的 切片 是 原 序列 。 由 一 对 整数 指定 。 
就 像 range 构造 器 那样 ， 第 一 个 整数 表示 切片 的 起 始 下 标 ， 个 表示 结束 下 标 加 一 。 


Python 中 ， 序 列 切片 的 表示 类 似 于 元 素 选 择 ， 使 用 方 括号 。 置 号 分 割 了 起 始 和 结束 下 标 。 任 
何 边界 上 的 省 略 都 被 当 作 极限 值 : 起 始 下 标 为 0， 结束 下 标 是 序列 长 度 。 


>>> digits[0:2] 
(1, 8) 

>>> digits[1:] 
(872 8) 


Python 序列 抽象 的 这 些 额外 行为 的 枚 举 ， 给 我 们 了 一 个 机 会 来 反思 数据 抽象 通常 由 什么 构 

成 。 抽 象 的 丰富 性 〈 也 就 是 说 它 包 含 行 为 的 多 少 ) 非常 重要 。 对 于 使 用 抽象 的 用 户 ， 人 额外 的 

行为 很 有 帮助 ， 另 一 方面 ， 满 足 新 类 型 抽象 的 丰富 需求 是 个 挑战 。 为 了 确保 我 们 的 递归 列表 

实现 支持 这 些 额 外 的 行为 ， 需 要 一 些 工 作 量 。 另 一 个 抽象 丰富 性 的 负面 结果 是 ， 它 们 需要 用 
户 长 时 间 学 习 。 


序列 拥有 丰富 的 抽象 ， 因 为 它们 在 计算 中 无 处 不 在 ， 所 以 学 习 一 些 复杂 的 行为 是 合理 的 。 通 
常 ， 多 数 用 户 定义 的 抽象 应 该 尽 可 能 简单 。 


扩展 阅读 。 切 片 ee ， 例如 负 的 起 始 值 ， 结 束 值 和 步 长 。Dive Into Python 
3 中 有 一 节 叫 做 列表 切片 ， 完 整 描 述 了 它 。 这 一 章 中 ， 我 们 只 会 用 到 上 面 描述 的 基本 特性 。 


2.3.6 字符 串 


文本 值 可 能 比 数值 对 计算 机 科学 来 说 更 基本 。 作 为 一 个 例子 ，Python 程序 以 文本 编写 和 储 
存 。Python 中 原生 的 文本 数据 类 型 叫做 字符 串 ， 相 应 的 构造 器 是 str 。 


关于 字符 串 在 Python 中 如 何 表示 和 操作 有 许多 细节 。 字 符 串 是 丰富 抽象 的 另 一 个 示例 ， 程 序 
员 需 要 满足 一 些 实质 性 要 求 来 掌握 。 这 一 节 是 字符 串 基 本 行为 的 摘要 。 


字符 串 字 面值 可 以 表达 任意 文本 ， 被 单 引号 或 者 双 引 号 包 国 


>>>> Tam sering 

Am Str 

>>> "I've got an apostrophe" 
Vegotranapostropher 

S53 你 好 


我 们 已 经 在 代码 中 见 过 字符 串 了 ， 在 print 的 调用 中 作为 文档 字符 串 ， 以 及 在 assert 语句 中 
作为 错误 信息 。 


字符 串 满 足 两 个 基本 的 序列 条 件 ， 我 们 在 这 一 节 开 始 介绍 过 它们 : 它们 拥有 长 度 并 且 支 持 元 
素 选择 。 


>>> city = "Berkeley， 
>>> len(city) 

8 

>>> city[3] 

| hy 


字符 串 的 元 素 本 身 就 是 包含 单一 字符 的 字符 串 。 字 符 是 字母 表 中 的 任意 单一 字符 ， 标 点 
号 ， 或 者 其 它 符 号 。 不 像 许 多 其 它 编程 语言 那样 ，Python 没有 单独 的 字符 类 型 ， 和 
是 字符 串 ， 表 示 单 一 字符 的 字符 串 长 度 为 1、 


就 像 元 组 ， 字 符 串 可 以 通过 加 法 和 乘法 来 组 合 : 


>>> City = "Berkeley， 
>>> len(city) 


>>> city[3] 


字符 串 的 行为 不 同 于 Python 中 其 它 序 列 类 型 。 字 符 串 抽象 没有 实现 我 们 为 元 组 和 范围 描述 的 
完整 序列 抽象 。 特 别 地 ， 字 符 串 上 实现 了 成 员 性 运算 符 in ， 但 是 与 序列 上 的 实现 具有 完全 不 
同 的 行为 。 它 匹配 子 字符 串 而 不 是 元 素 。 


>>> 'here' in "Where's Waldo?" 
True 


与 之 相似 ， 字 符 串 上 的 count 和 index 方法 接受 子 串 作为 参数 ， 而 不 是 单一 字符 。 count 的 
行为 有 细微 差别 ， 它 统计 字符 串 中 非 重 个 字 串 的 出 现 次 数 。 


>>> 'Mississippi'.count('i') 

4 

>>> 'Mississippi'.count('issi') 
1 


多 行文 本 。 字 符 串 并 不 限制 于 单行 文本 ， 三 个 引号 分 隔 的 字符 串 字 面值 可 以 跨越 多 行 。 我 们 
已 经 在 文档 字符 串 中 使 用 了 三 个 引号 。 


>>>> TnNesZen of PyEnon 

claims, Readability counts. 

Readmomes mampore tnasm 

The Zen of Python\nclaims, "Readability counts." \nRead more: import this." 


在 上 面 的 打印 结果 中 ，\n (叫做 “ 反 斜 杠 加 n”) 是 表示 新 行 的 单一 元 素 。 虽 然 它 表示 为 两 个 
字符 〈 反 斜 本 和 mn) 。 它 在 长 度 和 元 素 选 择 上 被 认为 是 单个 字符 。 


字符 囊 强 制 。 字 符 串 可 以 从 Python 的 任何 对 象 通过 以 某 个 对 象 值 作 为 参数 调用 str 构造 函数 
来 创建 ， 这 个 字符 串 的 特性 对 于 从 多 种 类 型 的 对 象 中 构造 描述 性 字符 串 非 常 实用 


>>>°Str(2) 1sanelement of + str(digrts) 
2 TS an element Oil 8 22098) 


str 了 叉 数 可 以 以 任何 类 型 的 参数 调用 ， 并 返回 合适 的 值 ， 这 个 机 制 是 后 面 的 泛 用 函数 的 主 
题 。 


方法 。 i 因为 大 量 的 方法 都 返回 字符 串 的 变 体 或 者 
搜索 其 内 容 。 一 部 分 这 些 方法 由 下 面 的 示例 介绍 。 


>>> '1234' .Isnumeric() 

True 

>>> 'rOBERT dE nNnIRO'.swapcase() 
"Robert De Niro' 

>>> 'snakeyes' .upper().endswith('YES') 
True, 


扩展 阅读 。 计 算 机 中 的 文本 编码 是 个 复杂 的 话题 。 这 一 章 中 ， 我 们 会 移 走 字符 串 如 何 表示 的 
细节 ， 但 是 ， 对 许多 应 用 来 说 ， 字 符 串 如 何 由 计 莫 机 编码 的 特定 细节 是 必要 的 知识 。Dive 
Into Python 3 的 4.1 ~4.3 节 提 供 了 字符 编码 和 Unicode 的 描述 。 


2.3.7 授 口 约定 


在 复合 数据 的 处 理 中 ， 我 们 强调 了 数据 抽 ee 入 数据 表示 的 细节 ， 
以 及 抽象 如 何 为 我 们 保留 灵活 性 来 党 试 备用 表示 。 这 一 节 中 ， 我 们 引入 了 另 一 种 强大 的 设计 
原则 来 处 理 数据 结构 -- 接口 约定 的 用 法 。 


接口 约定 使 在 许多 组 件 模 块 中 共享 的 数据 格式 ， 它 可 以 混合 和 匹配 来 展示 数据 。 例 如 ， 如 果 
我 们 拥有 多 个 函数 ， 它 们 全 部 接受 序列 作为 参数 并 且 返 回 序列 值 ， 我们 就 可 以 把 它们 每 一 个 
用 于 上 一 个 的 输出 上 ， 并 选 ee 这 样 ， 我 们 就 可 以 通过 将 函数 链接 成 流水 线 ， 
来 创建 一 个 复杂 的 过 程 ， 每 都 是 简单 而 专 一 的 。 


一 节 有 两 个 目的 ， 来 介绍 以 接口 约定 组 织 程序 的 概念 ， 以 及 展示 模块 化 序列 处 理 的 示例 。 


考虑 下 面 两 个 问题 ， 它 们 首次 出 现 ， 并 且 只 和 序列 的 使 用 相关 。 


1， 对 前 n 个 辈 波 那 契 “ 5 
2， 列 出 一 个 名 称 中 的 所 有 缩写 字母 ， 含 每 个 大 写 单词 的 首 字母 。 


这 些 问 题 是 有 关系 的 ， 因 为 它们 可 以 解构 为 简单 的 操作 ， 它 们 接受 序列 作为 输入 ， 并 产 出 序 
列 作 为 输出 。 而 且 ， 这 些 操 作 是 序列 上 的 计算 的 一 般 方法 的 实例 。 让 我 们 思考 第 一 个 问题 ， 
它 可 以 解构 为 下 面 的 步骤 : 


enumerate map filter accumulate 


naturals(n) fib iseven sum 


下 面 的 fib 函数 计算 了 辈 波 那 契 数 (现在 使 用 了 for 语句 更 新 了 第 一 章 中 的 定义 ) 。 


>>> def fib(k): 
"Gompute the kth Erbonacca number an 
prev, curr = 1, © # curr is the first Fibonacci number. 
for _ in range(k - 1): 
prev, curr = curr, prev + curr 
return curr 


谓词 iseven 可 以 使 用 整数 取 余 运算 符 % 来 定义 。 


>>> def iseven(n): 
neturnami% 2 ==”0 


map 和 filter 函数 是 序列 操作 ， 我 们 已 经 见 过 了 map ， 它 在 序列 中 的 每 个 元 素 上 调用 函数 
并 且 收 集结 果 。 filter 函数 接受 序列 ， 并 且 返 回 序 列 中 谓词 为 趴 的 元 素 。 两 个 函数 都 返回 间 
接 对 象 ， map 和 filter 对 象 ， 它 们 是 可 以 转换 为 元 组 或 求 和 的 可 和 迭代 对 象 。 


>>> nums = (5, 6, -7, -8, 9) 
>>> tuple(filter(iseven, nums)) 


(6, 8) 
>>> sum(map(abs, nums)) 
35 


现在 我 们 可 以 实现 even_fib ， 第 一 个 问题 的 解 ， 使 用 map 、 filter 和 sum 。 


>>> def sum even fibs(n): 
-Sumthe furst neven Eildonacca mnumberse 
return sum(filter(iseven, map(fib, range(1, n+1)))) 
>>> sum_even_fibs(20) 
3382 


现在 ， 让 我 们 思考 第 二 个 问题 。 它 可 以 解构 为 序列 操作 的 流水 线 ， 含 map 和 filter 。 


enumerate filter map accumulate 


words iscap first tuple 


字符 串 中 的 单词 可 以 通过 字符 串 对 象 上 的 split 方法 来 枚 举 ， 默 认 以 空格 分 定 


oo 


>>> tuple('Spaces between words'.split()) 
(Spacesy Detweens ,wondsy 


单词 的 第 一 个 字母 可 以 使 用 选择 运算 符 来 获取 ， 确 定 一 个 单词 是 否 大 写 的 谓词 可 以 使 用 内 建 
谓词 isupper 定义 。 
>>> def first(s): 
return s[0] 


>>> def iscap(s): 
return len(s) > 0 and s[0].isupper() 


这 里 ， 我 们 的 缩写 函数 可 以 使 用 map 和 filter 定义 。 


>>> def acronym(name ) : 
Return aantuple or thnenletters thatc form tne acronym for names, 
return tuple(map(first, filter(iscap, name.split()))) 
>>> acronym( 'University of California Berkeley Undergraduate Graphics Group') 
CU Gs B20 Us GL Ge) 


这 些 不 同 问 题 的 相似 解法 展示 了 如 何 使 用 通用 的 计 和 工 模 式 ， 例 如 上 映射、 过 滤 和 累计 ， 来 组 合 
序列 的 接口 约定 上 的 操作 。 序 列 抽象 让 我 们 编写 出 这 些 简明 的 解法 。 


eeew ee sw 
独立 片段 构建 ， 每 个 片段 都 对 序列 进行 转换 。 通 常 ， 我 们 可 以 通过 提供 带 有 接口 约定 的 标准 
组 件 库 来 鼓励 模块 化 设计 ， 接 口 约定 以 灵活 的 方式 连接 这 些 组 件 。 


生成 器 表达 式 。Python 语言 包含 第 二 个 处 理 序列 的 途径 ， 叫 做 生成 器 表达 式 。 它 提供 了 
与 map 和 reduce 相似 的 功能 ， 但 是 需要 更 少 的 函数 定义 。 


成 器 表达 式 组 合 了 过 滤 和 映射 的 概念 ， 并 集成 于 单一 的 表达 式 中 ， 以 下 面 的 形式 : 


<map expression> for <name> in <sequence expression> if <filter expression> 


为 了 求 出 生成 器 表达 式 ，Python 先 求 出 <sequence expression> ， 它 必须 返回 一 个 可 迁 代 值 。 
之 后 ， 对 于 每 个 元 素 ， 按 顺序 将 元 素 值 绑 定 到 cname> ， 求 出 过 滤器 表达 式 ， 如 果 它 产生 晶 
值 ， 就 会 求 出 映射 表达 式 。 


成 器 表达 式 的 求解 结果 值 本 身 是 个 可 和 迭代 值 。 和 累计 函数 ， 比 
如 tuple 、 sum 、max 和 min 可 以 将 返 回 的 对 象 作为 参数 。 


>>> def acronym(name ) : 
return tuple(w[0] for w in name.split() If iscap(w)) 
>>> def sum even_fibs(n): 
return sum(fib(k) for k in range(1, n+1) if fib(k) % 2 == 0) 


en 
了 map 和 filter 的 大 部 分 功能 ， 但 是 避免 了 被 调用 函数 的 实际 创建 (或 者 ， 顺 便 也 避免 了 环 
境 帧 的 创建 需要 调用 这 些 函 数 ) 。 


归 约 。 在 我 们 的 示例 中 ， 我 们 使 用 特定 的 函数 来 累计 结果 ， 例 如 tuple 或 者 sum 。 函 数 式 编 
程 语 言 (包括 Python ) 包含 通用 的 高 阶 累 加 器 ， 具 有 多 种 名 称 。 Python 在 functools 模块 中 
包含 reduce ， 它 对 序列 中 的 元 素 从 左 到 右 依次 调用 二 元 防 数 ， 将 序列 归 约 为 一 个 值 。 下 面 的 
表达 式 计 算 了 五 个 因数 的 积 。 


>>> from operator import mul 
>>> from functools import reduce 
>>> reduce(mul, (1, 2, 3, 4, 5)) 
120 


使 用 这 个 更 普遍 的 累计 形式 ， 除 了 求 和 之 外 ， 我 们 也 可 以 计算 辈 波 那 契 数列 中 奇数 的 积 ， 将 
序列 用 作 接口 约定 。 


>>> def product_even_fibs(n) : 
”Return the product of the first n even Fibonacci numbers, except ©O.™"" 
return reduce(mul, filter(iseven, map(fib, range(2, n+1)))) 

>>> product_even_fibs(20) 

123476336640 


与 map 、 filter 和 reduce 对 应 的 高 阶 过 程 的 组 合 会 再 一 次 在 第 四 章 出 现 ， 在 我 们 思考 多 台 
计算 机 之 间 的 分 布 式 计算 方法 的 时 候 。 


2.4 可 变数 据 


来 源 : 2.4 Mutable Data 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


我 们 已 经 看 到 了 抽象 在 帮助 我 们 应 对 大 型 系统 的 复杂 性 时 如 何 至 关 重 要 。 有 效 的 程序 整合 也 
需要 一 些 组 织 原则 ， 指 导 我 们 构思 程序 的 概要 设计 。 特 别 地 ， 我 们 需要 一 些 策略 来 帮助 我 们 
构建 大 型 系统 ， 使 之 模块 化 。 也 就 是 说 ， 它 们 可 以 “自然 "划分 为 可 以 分 离开 发 和 维护 的 各 个 相 


关 部 分 。 


我 们 用 于 创建 模块 化 程序 的 强大 工具 之 一 ， 是 引入 可 能 会 随时 间 改 变 的 新 类 型 数据 。 这 样 ， 
单个 数据 可 以 表示 独立 于 其 他 程序 演化 的 东西 。 对 象 行为 的 改变 可 能 会 由 它 的 历史 影响 ， 就 
像 世界 中 的 实体 那样 。 向 数据 添加 状态 是 这 一 章 最 终 目 标 : 面向 对 象 编程 的 要 素 。 


我 们 目前 引入 的 原生 数据 类 型 -- 数值 、 布 尔 值 、 元 组 、 范 围 和 字符 串 -- 都 是 不 可 变 类 型 的 对 
象 。 虽 然 名 称 的 绑 定 可 以 在 执行 过 程 中 修改 为 环境 中 不 同 的 值 ， 但 是 这 些 值 本 身 不 会 改变 。 
这 一 章 中 ， 我 们 会 介绍 一 组 可 变数 据 类 型 。 可 变 对 象 可 以 在 程序 执行 期 间 改 变 。 


2.4.1 局 部 状态 
我 们 第 一 个 可 变 对 象 的 例子 就 是 局 部 状态 。 这 个 状态 会 在 程序 执行 期 间 改变 。 


为 了 展示 函数 的 局 部 状态 是 什么 东西 ， 让 我 们 对 从 银行 取 钱 的 情况 进行 建 模 。 我 们 会 通过 创 
建 叫做 withdraw 的 函数 来 实现 它 ， 它 将 要 取出 的 金额 作为 参数 。 如 果 账 户 中 有 足够 的 钱 来 取 
出 ， withdraw 应 该 返回 取 钱 之 后 的 余额 。 否 则 ， withdraw 应 该 返回 消 

息 'Insufficient funds' 。 例 如 ， 如 果 我 们 以 账户 中 的 $100 开始， 我 们 希望 通过 调 

用 withdraw 来 得 到 下 面 的 序列 : 


>>> withdraw(25) 

区 

>>> withdraw(25) 

50 

>>> withdraw(60) 
Tnsuttrierent hunds, 
>>> withdraw(15) 

35 


观察 表达 式 withdraw(25) ， 求 值 了 两 次 ， 产 生 了 不 同 的 值 。 这 是 一 种 用 户 定义 函数 的 新 行 
为 : 它 是 非 纯 函数 。 调 用 函数 不 仅仅 返回 一 个 值 ， 同 时 具有 以 一 些 方式 修改 函数 的 副作用 ， 
使 带 有 相同 参数 的 下 次 调用 返回 不 同 的 结果 。 我 们 所 有 用 户 定义 的 函数 ， 到 目前 为 止 都 是 纯 


函数 ， 除 非 他 们 调用 了 非 纯 的 内 建 函 数 。 它 们 仍旧 是 纯 函 数 ， 因 为 它们 并 不 允许 修改 任何 在 
局 部 环境 帧 之 外 的 东西 。 


为 了 使 withdraw 有 意义 ， 它 必须 由 一 个 初始 账户 余额 创建 ° make withdraw 欧 数 是 个 高 阶 函 
数 ， 接受 起 始 余额 作为 参数 ” withdraw 鸥 数 是 它 的 返回 值 9 


>>> withdraw = make_withdraw(100) 


make_withdraw 的 实现 需要 新 类 型 的 语句 : nonlocal 语 钉 。 当 我 们 调用 make withdraw 时 ， 
我 们 将 名 称 balance 绑 定 到 初始 值 上 。 之 后 我 们 定义 并 返回 了 局 部 函数 ， withdraw ， 它 在 调 
用 时 更 新 并 返回 balance 的 值 。 


>>> def make withdraw(balance): 
"""Return a withdraw function that draws down balance with each call.""" 
def withdraw(amount ) : 
nonlocal balance # Declare the name "balance" nonlocal 
if amount > balance: 
return 'Insufficient funds' 
balance = balance - amount # Re-bind the existing balance name 
return balance 
return withdraw 


这 个 实现 的 新 奇 部 分 是 nonlocal 语句 ， 无 论 什么 时 候 我 们 修改 了 名 称 balance 的 绑 定 ， 绑 定 
都 会 在 balance 所 绑 定 的 第 一 个 帧 中 修改 。 回 忆 一 下 ， 在 没有 nonlocal 语 名 的 情况 下 ， 赋 值 
语 多 总 是 会 在 环境 的 第 一 个 帧 中 绑 定 名 称 。 nonlocal 语句 表明 ， 名 称 出 现在 环境 中 不 是 第 一 
个 (局部) 帧 ， 或 者 最 后 一 个 〈 全 局 ) 帧 的 其 它 地方 。 


我 们 可 以 将 这 些 修 改 使 用 环境 图 示 来 可 视 化 。 下 面 的 环境 图 示 展 示 了 每 个 调用 的 效果 ， 以 上 
面 的 定义 开始 。 我 们 省 略 了 函数 值 中 的 代码 ， 以 及 不 在 我 们 讨论 中 的 表达 式 树 。 


make_withdraw: 人 
下 make_withdraw i 





我 们 的 定义 语句 拥有 平常 的 效果 : 它 创 建 了 新 的 用 户 定义 函数 ， 并 且 将 名 称 make_withdraw 在 
全 局 帧 中 绑 定 到 那个 函数 上 。 


下 面 ， 我 们 使 用 初始 的 余额 参数 29 来 调用 make withdraw 。 


>>> wd = make_withdraw(20) 


这 个 赋值 语句 将 名 称 wd 绑 定 到 全 局 帧 中 的 返回 函数 上 : 





make_withdraw: 


wd : 








balance: 20 


RN >| withdraw: -1 起 


withdraw(amount): LL _ 


| nonlocal vis 


make_withdraw 






make_withdraw(20) 





def withdraw(amount ) : 





bP wd = make withdraw(20) 





+ 1 和 nn 和 和 
return withdraw 





所 返回 的 函数 ， (内 部 ) 叫做 withdraw ， 和 定义 所 在 位 置 即 make_withdraw 的 局 部 环境 相关 
联 。 名 称 balance 在 这 个 局 部 环境 中 绑 定 。 在 例子 的 剩余 部 分 中 ， balance 名 称 只 有 这 一 个 
绑 定 ， 这 非常 重要 。 


下 面 ， 我 们 求 出 以 总 数 5 调用 withdraw 的 表达 式 的 值 : 
>>> wd(5) 
15 
名 称 wd 绑 定 到 了 withdraw 函数 上 ， 所 以 withdraw 的 函数 体 在 新 的 环境 中 求 值 ， 新 的 环境 扩 


展 自 withdraw 定义 所 在 的 环境 。 跟 踪 withdraw 求 值 的 效果 展示 了 Python 中 nonlocal 语句 
的 效果 。 





make_withdraw: 





wd : 







eo—> 
wa | mount ST balance: 15 


withdraw withdraw: i | 


withdraw(amount ) : LL 


| …， nonlocal ... 


make_withdraw 


nonlocal balance 


wd = make_withdraw(20) 


balance = balance - amount b> wd(5) 
return balance 





withdraw 的 赋值 语句 通常 在 withdraw 的 局 部 帧 中 为 balance 创建 新 的 绑 定 。 由 
于 nonlocal 语句 ， 赋 值 运算 找到 了 balance 定义 位 置 的 第 一 帧 ， 并 在 那里 重新 绑 定 名 称 。 如 
果 balance 之 前 没有 绑 定 到 值 上 ， 那 么 nonlocal 语句 会 产生 错误 。 


通过 修改 balance 绑 定 的 行为 ， 我 们 也 修改 了 withdraw 函数 。 下 次 withdraw 调用 的 时 候 ， 
名 称 balance 会 求 值 为 15 而 不 是 20 。 


当 我 们 第 二 次 调用 wd 时 ， 


>>> wd(3) 
12 


我 们 发 现 绑 定 到 palance 的 值 的 修改 可 在 两 个 调用 之 间 积 系 。 





make_withdraw: 





wd : 





| amount: 5 balance: 12 


withdraw withdraw: | 


| amount: 3 | make_withdraw withdraw(amount): LL 
withdraw | 习 Y 业 | , 硬 nonlocal LE 


:..(@) Nonlocal balance wd = make_withdraw(20) 


balance = balance =- amount 
1 wd(5) 
return balance b> wd(3) 





这 里 ， 第 二 次 调用 withdraw 会 创建 第 二 个 局 部 帧 ， 像 之 前 一 样 ， 但 是 ， withdraw 的 两 个 帧 
都 扩展 自 make_withdraw 的 环境 ， 它 们 都 包含 balance 的 绑 定 。 所 以 ， 它 们 共享 特定 的 名 称 绑 
定 ， 调 用 withdraw 具有 改变 环境 的 副作用 ， 并 且 会 由 之 后 的 withdraw 调用 继承 。 


实践 指南 。 通 过 引入 nonlocal 语 多 ， 我 们 发 现 了 赋值 语 名 的 双重 作用 。 它 们 修改 局 部 绑 定 ， 
或 者 修改 非 局 部 绑 定 。 实 际 上 ， 赋 值 语句 已 经 有 了 两 个 作用 : 创建 新 的 绑 定 ， 或 者 重新 绑 定 
现 有 名 称 。Python 赋值 的 许多 作用 使 赋值 语句 的 执行 效果 变 得 模糊 。 作 为 一 个 程序 员 ， 你 应 
该 用 文档 清晰 记录 你 的 代码 ， 使 赋值 的 效果 可 被 其 它 人 理解 。 


2.4.2 非 局 部 赋值 的 好 处 


非 局 部 赋值 是 将 程序 作为 独立 和 自主 的 对 象 观 察 的 重要 步骤 ， 对 象 彼此 交互 ， 但 是 各 自 管 理 
各 自 的 内 部 状态 。 


特别 地 ， 非 局 部 赋值 提供 了 在 函数 的 局 部 范围 中 维护 一 些 状态 的 能 力 ， 这 些 状态 会 在 函数 之 
后 的 调用 中 演化 。 和 特定 withdraw 哆 数 相关 的 balance 在 所 有 该 函数 的 调用 中 共享 。 但 
是 ， withdraw 实例 中 的 balance 绑 定 对 程序 的 其 余部 分 不 可 见 。 只 有 withdraw 关联 到 

了 _ make_withdraw 的 帧 ， withdraw 在 那里 被 定义 。 如 果 make_withdraw 再 次 调用 ， 它 会 创建 
单独 的 帧 ， 带 有 单独 的 balance 绑 定 。 


我 们 可 以 继续 以 我 们 的 例子 来 展示 这 个 观点 。 make_withdraw 的 第 二 个 调用 返回 了 第 二 
个 withdraw 函数 ， 它 关联 到 了 另 一 个 环境 上 。 


>>> wd2 = make_withdraw(7) 


第 二 个 withdraw 函数 绑 定 到 了 全 局 帧 的 名 称 wd2 上 。 我 们 使 用 星 号 来 省 略 了 表示 这 个 绑 定 的 
线 。 现 在 ， 我 们 看 到 实际 上 有 两 个 balance 的 绑 定 。 名 称 wd 仍旧 绑 定 到 余额 
为 12 的 withdraw 函数 上 ， 而 wd2 绑 定 到 了 余额 为 7 的 新 的 withdraw 函数 上 。 








make_withdraw: 


wd: 二 make_withdraw < 


balance: 12 
withdraw: ——— 


make_withdraw withdrawl(amount): LL 
”~ 


balance: 7 一 
withd raw: © 


Es 


make_withdraw 








make_withdraw(7) wd = make_withdraw(20) 


wd(5) 
wd(3) 
b> wd2 = make_withdraw(7) 


.©) def withdraw(amount): 





return withdraw 


最 后 ， 我 们 调用 绑 定 到 wd2 上 的 第 二 个 withdraw 函数 : 


>>> wd2(6) 
了 


这 个 调用 修改 了 非 局 部 名 称 balance 的 绑 定 ， 但 是 不 影响 在 全 局 帧 中 绑 定 到 名 称 wd 的 第 一 


个 withdraw 。 





make_withdraw: 
wd : 


wd2 : 一 的 


— lmake_wi thdraw ss 









t 


balance: 12 了 


withdraw: 一 
make_withdraw wi tharaw( amount ) | 
Ee E 
.…>| amount: 6 batances 1 一 | 一 一 一 一 一 
withdraw withdraw: a 

make_withdraw withdraw(amount): LL 
wd2(6) wd = make_withdraw(20) 

nonlocal balance wd (5) 

wd (3) 


wd2 = make_withdraw(7) 
Pb wd2(6) 


balance = balance - amount 
return balance 





这 样 ，withdraw 的 每 个 实例 都 维护 它 自己 的 余额 状态 ， 但 是 这 个 状态 对 程序 中 其 它 函 数 不 可 
见 。 在 更 高 层面 上 观察 这 个 情况 ， 我 们 创建 了 银行 账户 的 抽象 ， 它 管理 自己 的 内 部 状态 ， 但 
以 一 种 方式 对 站 实 世界 的 账户 进行 建 模 : 它 基 于 自己 的 历史 提取 请 求 来 随时 间 变 化 。 


2.4.3 非 局 部 赋值 的 代价 


我 们 扩展 了 我 们 的 计算 环境 模型 ， 用 于 解释 非 局 部 赋值 的 效果 。 但 是 ， 非 局 部 复制 与 我 们 思 
考 名 称 和 值 的 方式 有 一 些 细微 差异 。 


之 前 ， 我 们 的 值 并 没有 改变 ， 仅 仅 是 我 们 的 名 称 和 绑 定 发 生 了 变化 。 当 两 个 名 称 a 和 b 绑 定 
到 4 上 时 ， 它 们 绑 定 到 了 相同 的 4 还 是 不 同 的 4 并 不 重要 。 我 们 说 ， 只 有 一 个 4 对 象 ， 并 
且 它 永 不 会 改变 。 


但 是 ， 带 有 状态 的 函数 不 是 这 样 的 。 当 两 个 名 称 wd 和 wd2 都 绑 定 到 withdraw 函数 时 ， 它 们 
绑 定 到 相同 函数 还 是 函数 的 两 个 不 同 实 例 ， 就 很 重要 了 。 考 虑 下 面 的 例子 ， 它 与 我 们 之 前 分 
析 的 那个 正好 相反 : 


>>> wd = make_withdraw(12) 
>>> wd2 = wd 

>>> wd2(1) 

411 

>>> wd(1) 

10 


这 里 ， 通 过 wd2 调用 有 函数 会 修改 名 称 为 wd 的 郊 数 的 值 ， 因 为 两 个 名 称 都 指向 相同 的 函数 。 
这 些 语句 执行 之 后 的 环境 图 示 展 示 了 这 个 现象 : 





make_withdraw: 








wd: 


BO—> 
| amount: 5 | balance: 12 


withdraw withdraw: se | 


e > 
we amount: 3 ] make_withdraw withdraw(amount): | 
: withdraw | ri? MOMNLOCAaL si 





nonlocal balance 


ee wd = make_withdraw(20) 
balance = balance - amount wd (5) 
return balance b> wd (3) 


. 
+ 1 + 





两 个 名 称 指向 同一 个 值 在 世界 上 不 常见 ， 但 我 们 程序 中 就 是 这 样 。 但 是 ， 由 于 值 会 随时 间 改 
变 ， 我 们 必须 非常 仔细 来 理解 其 它 名 称 上 的 变化 效果 ， 它 们 可 能 指向 这 些 值 。 


正确 分 析 带 有 非 局 部 赋值 代码 的 关键 是 ， 记 住 中 有 函数 调用 可 以 创建 新 的 帧 。 赋 值 语 馈 始 终 
改变 现 有 帧 中 的 绑 定 。 这 里 ， 除 非 make_withdraw 调用 了 两 次 ， balance 还 是 只 有 一 个 绑 定 。 


变 与 不 变 。 这 些 细微 差别 出 现 的 原因 是 ， 通 过 引入 修改 非 局 部 环境 的 非 纯 函 数 ， 我 们 改变 了 
表达 式 的 本 质 。 只 含有 纯 函 数 的 表达 式 是 引用 透明 (referentially transparent) 的 。 如 果 我 们 
将 它 的 子 表达 式 换 成 子 表达 式 的 值 ， 它 的 值 不 会 改变 。 


重新 绑 定 的 操作 违反 了 引用 透明 的 条 件 ， 因 为 它们 不 仅仅 返回 一 个 值 。 它 们 修改 了 环境 。 妆 
我 们 引入 任意 重 绑 定 的 时 候 ， 我 们 就 会 遇 到 一 个 环 手 的 认识 论 问题 : 它 对 于 两 个 相同 的 值 意 
味 着 什么 。 在 我 们 的 计算 环境 模型 中 ， 两 个 分 别 定 义 的 函数 并 不 是 相同 的 ， 因 为 其 中 一 个 的 
改变 并 不 影响 另 一 个 。 


通常 ， 只 要 我 们 不 会 修改 数据 对 象 ， 我 们 就 可 以 将 复合 数据 对 象 看 做 其 部 分 的 总 和 。 例 如 ， 

有 理 数 可 以 通过 提供 分 子 和 分 母 来 确定 。 但 是 这 个 观点 在 变化 出 现时 不 再 成 立 了 ， 其 中 复合 
数据 对 象 拥有 一 个 "身份 ”， 不 同 于 组 成 它 的 各 个 部 分 。 即 使 我 们 通过 取 钱 来 修改 了 余额 ， 某 个 
银行 账户 还 是 “相同 ”的 银行 账户 。 相 反 ， 我 们 可 以 让 两 个 银行 账户 碰巧 具有 相同 的 余额 ， 但 它 
们 是 不 同 的 对 象 。 


尽管 它 引 入 了 新 的 困难 ， 非 局 部 赋值 是 个 创建 模块 化 编程 的 强大 工具 ， 程 序 的 不 同 部 分 ， 对 
应 不 同 的 环境 帧 ， 可 以 在 程序 执行 中 独立 演化 。 而 且 ， 使 用 带 有 局 部 状态 的 函 数 ， 我 们 就 能 
实现 可 变数 据 类 型 。 在 这 一 节 的 剩余 部 分 ， 我 们 介绍 了 一 些 最 实用 的 Python 内 建 数 据 类 型 ， 
以 及 使 用 带 有 非 局 部 赋值 的 函数 ， 来 实现 这 些 数 据 类 型 的 一 些 方法 。 


2.4.4 列表 


list 是 Python 中 最 使 用 和 灵活 的 洗 了 类 型 。 列 表 类 似 于 元 组 ， 但 是 它 是 可 变 的 。 方 法 调用 
和 赋值 语句 都 可 以 修改 列表 的 内 容 。 


我 们 可 以 通过 一 个 展示 ( 极 大 简化 的 ) 扑克 牌 历史 的 例子 ， 来 介绍 许多 列表 编辑 操作 。 例 子 
中 的 注释 描述 了 每 个 方法 的 效果 。 


扑克 有 牌 发 明 于 中 国 ， 大 概 在 9 世纪 。 早 期 的 牌 组 中 有 三 个 花色 ， 它 们 对 应 钱 的 三 个 面额 。 


>>> chinese suits = ['coin', 'string', 'myriad'] # A list literal 
>>> suits = chinese suits # Two names refer to the same list 


扑克 上 牧 传 到 欧洲 (也 可 能 通过 埃及 ) 之 后 ， 西 班 牙 的 牌 组 (oro) 中 之 只 保留 了 硬币 的 花色 。 


>>> suits.pop() # Removes and returns the final element 
"myrIad ' 
>>> suits.remove('string') # Removes the first element that equals the argument 


然后 又 添加 了 三 个 新 的 花色 (它们 的 设计 和 名 称 随时 间 而 演化 ) ， 


>>> suits.append('cup') # Add an element to the end 
>>> suits.extend(['sword', 'club']) AddralneLlementsot ranst to thesend 


亲 


大 利 人 把 剑 叫 做 “ 黑 桃 ”: 


>>> suits[2] = 'spade' # Replace an element 


下 面 是 传统 的 意大利 牌 组 : 


>>> suits 
econm.e cu shade ee club dl 


我 们 现在 在 美国 使 用 的 法 式 变 体 修改 了 前 两 个 : 


>>> 王 SUnuts[g9x2E= 吉 Niheartandramonmdn we Replace larslice 
>>> suits 
heart ee dramond 0 spades cLub dd 


也 存在 用 于 插入 、 排 序 和 反 转 列表 的 操作 。 所 有 这 些 修改 操作 都 改变 了 列表 的 值 ， 它 们 并 不 
创建 新 的 列表 对 象 。 


共享 和 身份 。 由 于 我 们 修改 了 一 个 列表 ， 而 不 是 创建 新 的 列表 ， 绑 定 到 名 称 chinese_suits 上 
的 对 象 也 改变 了 ， 因 为 它 与 绑 定 到 suits 上 的 对 象 是 相同 的 列表 对 象 。 


>>> chinese suits # This name co-refers with "suits" to the Same list 
heart dramondh spade club 


列表 可 以 使 用 list 构造 函数 来 复制 。 其 中 一 个 的 改变 不 会 影响 另 一 个 ， 除 非 它们 共享 相同 的 
结构 。 


>>> nest = list(suits) # Bind "nest" to a second list with the same elements 
>>> nest[0] = suits oreate anmestednlsE 


在 最 后 的 赋值 之 后 ， 我 们 只 剩 下 下 面 的 环境 ， 其 中 列表 使 用 盒子 和 指针 的 符号 来 表示 : 


chinese_suits: 


sults: 











根据 这 个 环境 ， 修 改 由 suites 指向 的 列表 会 影响 nest 第 一 个 元 素 的 郁 套 列表 ， 但 是 不 会 影 
响 其 他 元 素 : 


>>>>SUntS LNnSsert(2 0 Joker Amsere an elemenerat endex 2 shahting therest 
>>> nest 
Weneare dramond we Joker spade > elub | dramnonu spade elubyd 


与 之 类 似 ， 在 next 的 第 一 个 元 素 上 撤销 这 个 修改 也 会 影响 到 suit 。 

由 于 这 个 pop 方法 的 调用 ， 我 们 返回 到 了 上 面 描述 的 环境 。 

由 于 两 个 列表 具有 相同 内 容 ， 但 是 实际 上 是 不 同 的 列表 ， 我 们 需要 一 种 手段 来 测试 两 个 对 象 
是 否 相 同 。Python 引入 了 两 个 比较 运算 符 ， 叫 做 is 和 is not ， 测 试 了 两 个 表达 式 实际 上 是 
否 求 值 为 同一 个 对 象 。 如 果 两 个 对 象 的 当前 值 相 等 ， 并 且 一 个 对 象 的 改变 始终 会 影响 另 一 
个 ， 那 么 两 个 对 象 是 同一 个 对 象 。 身 份 是 个 比 相等 性 更 强 的 条 件 。 


译 者 注 : 两 个 对 象 当 且 仅 当 在 内 存 中 的 位 置 相 同时 为 同一 个 对 象 。CPython 的 实现 直接 
比较 对 象 的 地 址 来 确定 


>>> suits is nest[0] 


Tne 

>>>°>SUntS Tel heart danond spaden club 
Ealse 

>>> suits == ['heart', 'diamond', 'spade', 'club'] 
True 


最 后 的 两 个 比较 展示 了 is 和 == 的 区 别 ， 前 者 检查 身份 ， 而 后 者 检查 内 容 的 相等 性 
列表 推导 式 。 列 表 推导 式 使 用 扩展 语法 来 创建 列表 ， 与 生成 器 表达 式 的 语法 相似 。 


例如 ， unicodedata 模块 跟踪 了 Unicode 字母 表 中 每 个 字符 的 官方 名 称 。 我 们 可 以 查找 与 名 
称 对 应 的 字符 ， 包 人 钨 这 些 卡 牌 花色 的 字符 。 


>>> from unicodedata import lookup 
>>> [lookup(' WE "supper()rY SUIT') for sin suzkts] 
>'] 


[eS Tw1 | 
着 | Ee 


列表 推导 式 使 用 序列 的 接口 约定 增强 了 数据 处 理 的 范式 ， 因 为 列表 是 一 种 序列 数据 类 型 。 


扩展 阅读 。Dive Into Python 3 的 推导 式 一 章 包 含 了 一 些 示例 ， 展 示 J Python 浏览 
计算 机 的 文件 系统 。 这 一 章 介 绍 了 os 模块 ， 它 可 以 列 出 目录 的 内 容 。 这 个 材料 并 不 是 这 门 课 
的 一 部 分 ， 但 是 推荐 给 任何 想 要 增加 Python 知识 和 技巧 的 人 。 


实现 。 列 表 是 序列 ， 就 像 元 组 一 样 。Python 语言 并 不 提供 给 我 们 列表 实现 的 直接 方法 ， 只 提 


供 序列 抽象 ， 和 我 们 在 这 一 节 介 绍 的 可 变 方法 。 0 言 层 面 的 抽象 界限 ， 我 们 可 
以 开发 列表 的 函数 式 实现 ， 再 次 使 用 递归 表示 。 这 一 节 也 有 第 二 个 目的 : 加 深 我 们 对 调度 函 
数 的 理解 。 


我 们 会 将 列表 实现 为 函数 ， 它 将 一 个 递归 列表 作为 自己 的 局 部 状态 。 列 表 需 要 有 一 个 身份 ， 
就 像 任何 可 变 值 那样 。 特 别 地 ， 我 们 不 能 使 用 None 来 表示 任何 空 的 可 变 列表 ， 因 为 两 个 空 列 
表 并 不 是 相同 的 值 (例如 ， 向 一 个 列表 添加 元 素 并 不 会 添加 到 另 一 个 ) ， 但 

是 None is None 。 另 一 方面 ， 两 个 不 同 的 函数 足以 区 分 两 个 两 个 空 列表 ， 它 们 都 

将 empty_rilist 作为 局 部 状态 ° 


我 们 的 可 变 列表 是 个 调度 函数 ， 就 像 我 们 偶 对 的 函数 式 实现 也 是 个 调度 函数 。 它 检查 输入 “ 信 
息 "是 否 为 已 知 信息 ， 并 且 对 每 个 不 同 的 输入 执行 相应 的 操作 。 我 们 的 可 变 列表 可 响应 五 个 不 
es 息 。 前 两 个 实现 了 序列 抽象 的 行为 。 接 下 来 的 两 个 添加 或 删除 列表 的 第 一 个 元 素 。 最 
后 的 信息 返回 整个 列表 内 容 的 字符 串 表 示 。 


>>> def make mutable_rlist(): 
RetcunnEaanunctcronalnplenenmcataonEoFamucablesnecurslVe TS 
contents = empty_rlist 
def dispatch(message, value=None): 
nonlocal contents 


If message == 'len': 

return len_rlist(contents) 
elif message == 'getitem': 

return getitem rlist(contents, value) 
elif message == 'push_first': 

contents = make_rlist(value, contents) 
elif message == 'pop_first': 


f = first(contents) 
contents = rest(contents) 
Retunmmaet 
elif message == 'str': 
return str(contents) 
return dispatch 


我 们 也 可 以 添加 一 个 辅助 函数 ， 来 从 任何 内 建 序 列 中 构建 函数 式 实现 的 递归 列表 。 只 需要 以 
递归 顺序 添加 每 个 元 素 。 


>>> def to_ mutable_rlist(source): 
RetunnEaanunctionalnstwtnukthnensameEcontenmEsasEEsourcCen 
s = make_mutable_rlist() 
for element In reversed(source): 
s('push_first', element) 
neturmes 


在 上 面 的 定义 中 ， 郊 数 reversed 接受 并 返回 可 和 迭代 值 。 它 是 使 用 序列 的 接口 约定 的 另 一 个 示 
例 o 


这 里 ， 我 们 可 以 构造 函数 式 实现 的 列表 ， 要 注意 列表 自身 也 是 个 函数 。 


>>> s = to_mutable_rlist(suits) 

>>> type(s) 

<class 'function'> 

>>> s('str') 

"('heart', ('diamond', ('spade', ('club', None))))" 


另外 ， 我 们 可 以 像 列表 s 传递 信息 来 修改 它 的 内 容 ， 比 如 移 除 第 一 个 元 素 。 


>>>S( popafmst) 

heart. 

>>>%S( .Str 

(diamond spade club NonedDy 


原则 上 ， 操 作 push_ first 和 pop_first 足以 对 列表 做 任意 修改 。 我 们 总 是 可 以 清空 整个 列 
表 ， 之 后 将 它 旧 的 内 容 赫 换 为 想 要 的 结果 。 


消息 传递 。 给 予 一 些 时 间 ， 我 们 就 能 实现 许多 实用 的 Python 列表 可 变 操 作 ， 比 
如 extend 和 insert 。 我 们 有 一 个 选择 : 我 们 可 以 将 它们 全 部 实现 为 函数 ， 这 会 使 用 现 有 的 
消息 pop_first 和 push_first 来 实现 所 有 的 改变 操作 。 作 为 代替 ， 我 们 也 可 以 向 dispatch 函 


数 体 添 加 额外 的 elif 子 甸 ， 每 个 子 多 检查 一 个 消息 〈 例 如 'extend' ) ， 并 且 直 接 
在 contents 上 做 出 合适 的 改变 。 


第 二 个 途径 叫做 消息 传递 ， 它 把 数据 值 上 面 所 有 操作 的 逻辑 封装 在 一 个 函数 中 ， 这 个 函数 响 
应 不 同 的 消息 。 一 个 使 用 消息 传递 的 程序 定义 了 调度 函数 ， 每 个 函数 都 拥有 局 部 状态 ， 通 过 
传递 "消息 "作为 第 一 个 参数 给 这 些 函 数 来 组 织 计算 。 消 息 是 对 应 特定 行为 的 字符 串 。 


可 以 想象 ， 在 dispatch 的 兄 数 体 中 通过 名 称 来 枚 举 所 有 这 些 消息 非常 无 聊 ， 并 且 易 于 出 现 错 
误 。Python 的 字典 提供 了 一 种 数据 类 型 ， 会 帮助 我 们 管理 消息 和 操作 之 间 的 映射 ， 它 会 在 下 
一 节 中 介绍 o 


J - 


2.4.5 字典 


字典 是 Python 内 建 数据 类 型 ， 用 于 储存 和 操作 对 应 关系 。 字 典 包 Gon 和 时， 其 中 键 和 值 都 
可 以 是 对 象 。 字 典 的 目的 是 提供 一 种 抽象 ， 用 于 储存 和 获取 下 标 不 是 连续 整数 ,而 是 描述 性 
的 键 的 值 。 


字符 串通 常用 作 键 ， 因 为 字符 串通 常用 于 表示 事物 名 称 。 这 个 字典 字面 值 提供 了 不 同 罗马 数 
字 的 值 。 


>>>==numerads = 0 /510 
我 们 可 以 使 用 元 素 选择 运算 符 ， 来 通过 键 查找 值 ， 我 们 之 前 将 其 用 于 序列 。 


>>> numerals[ 'X'] 
过 个 


字典 的 每 个 键 最 多 只 能 拥有 一 个 值 。 添 加 新 的 键 值 对 或 者 修改 某 个 键 的 已 有 值 ， 可 以 使 用 赋 
值 运算 符 来 完成 。 

>>> numerals['I'] = 1 

>>> numerals['L'] = 50 


>>> numerals 
TO 0/ 


要 注意 ，'L' 并 没有 添加 到 上 面 输出 的 末尾 。 字 典 是 无 序 的 键 值 对 集合 。 当 我 们 打印 字典 
时 ， 键 和 值 都 以 某 种 顺序 来 泻 染 ， 但 是 对 语言 的 用 户 来 说 ， 不 应 假设 顺序 总 是 这 样 。 
字典 折 象 也 支持 多 种 方法 3 来 从 整体 上 选 代 字典 中 的 内 容 。 方 法 keys 、 Values 和 items 都 


字 
返回 可 先 代 的 值 。 


>>> sum(numerals.values()) 
66 


通过 调用 dict 构造 了 兄 数 ， 键 值 对 的 列表 可 以 转换 为 字典 。 


>>>°dict(l(3 9 (a 1 (5 25)0) 
(30 4 16 0025 


字典 也 有 一 些 限制 : 
。 字典 的 键 不 能 是 可 变 内 建 类 型 的 对 象 。 
e 一 个 给 定 的 键 最 多 只 能 有 一 个 值 。 


第 一 条 限制 被 绑 定 到 了 Python 中 字典 的 底层 实现 上 。 这 个 实现 的 细节 并 不 是 这 门 课 的 主题 。 
直觉 上 ， 键 告诉 了 Python 应 该 在 内 存 中 的 哪里 寻找 键 值 对 ; 如 果 键 发 生 改 变 ， 键 值 对 就 会 丢 


失 oo 
ee 典 抽象 的 结果 ， 它 为 储存 和 获取 某 个 键 的 值 而 设计 。 如 果 字 典 中 最 多 只 存在 


oa 个 键 的 一 个 值 。 


由 字典 实现 的 一 个 实用 方法 是 get ， 如 果 键 存在 的 话 ， 它 返回 键 的 值 ， 否 则 返回 一 个 默认 
值 。 get 的 参数 是 键 和 默认 值 。 


>>> numerals.get('A', 0) 
0 
>>> numerals.get('V', 0) 
与 


字典 也 拥有 推导 式 语 法 ， 和 列表 和 生成 器 表达 式 类 似 。 求 解 字典 推导 式 会 产生 新 的 字典 对 


O 


>>> {X: x*x for x in range(3,6)} 
3:97 4 6 95:25 


实现 。 我 们 可 以 实现 一 个 抽象 数据 类 型 ， 它 是 一 个 记录 的 列表 ， 与 字典 抽象 一 致 。 每 个 记录 
都 是 两 个 元 素 的 列表 ， 包 含 键 和 相关 的 值 。 


>>> def make_dict() 
“Retunmaafunctionalaimplementationnof adnctionNnarye 
records = [] 
def get1item(Key): 
for k, v in records: 
if k == key: 
Peturnv 
def setitem(key, value): 
for item in records: 
If item[0] == key: 
item[1] = value 
Reon 
records.append([key, value]) 
def dispatch(message, key=None, value=None): 


If message == 'getitem': 
return getitem(key) 
elif message == 'setitem': 
setitem(key, value) 
elif message == 'keys': 
return tuple(k for k, _ in records) 
elif message == 'values': 


return tuple(v for _, v in records) 
return dispatch 


同样 ， 我 们 使 用 了 传递 方法 的 消息 来 组 织 我 们 的 实现 。 我 们 已 经 支持 了 四 种 消 

息 : getitem 、 setitem 、 keys 和 values 。 要 查找 茶 个 键 的 值 ， 我们 可 以 迭代 这 些 记录 来 
寻找 一 个 匹配 的 键 。 要 插入 某 个 键 的 值 ， 我 们 可 以 迭代 整个 记录 来 观察 是 否 已 经 存在 带 有 这 
个 键 的 记录 。 如 果 没 有 ， 我 们 会 构造 一 条 新 的 记录 。 如 果 已 经 有 了 带 有 这 个 键 的 记录 ， 我 们 
将 这 个 记录 的 值 设 为 新 的 值 。 


我 们 现在 可 以 使 用 我 们 的 实现 来 储存 和 获取 值 。 


>>> d = make_dict() 
>>>>dl( setatem .e309 
>>> d( "setitem', 4, 16) 
>>> d( getitem' ”3) 
>>> d('getitem', 4) 
>>> d('keys') 

4 


>>> d('values') 
(9, 16) 


这 个 字典 实现 并 不 为 快速 的 记录 检索 而 优化 ， 因 为 每 个 响应 getitem 消息 都 必须 和 迭代 整 
个 records 列表 . 内 建 的 字典 类 型 更 加 高 训 ° 


2.4.6 示例 : 传播 约束 


可 变数 据 允 许 我 们 模拟 带 有 变化 的 系统 ， 也 允许 我 们 构建 新 的 抽象 类 型 。 在 这 个 延伸 的 实例 
中 ， 我 们 组 合 了 非 局 部 赋值 、 列 表 和 字典 来 构建 一 个 基于 约束 的 系统 ， 支 持 多 个 方向 上 的 计 
算 。 将 程序 表达 为 约束 是 一 种 声明 式 编程 ， 其 中 程序 员 声 明 需 要 求解 的 问题 结构 ， 但 是 抽象 
了 问题 解决 方案 如 何 计算 的 细节 。 


计算 机 程序 通常 组 织 为 单方 向 的 计算 ， 它 在 预先 设 定 的 参数 上 执行 操作 ， 来 产生 合理 的 输 
出 。 另 一 方面 ， 我 们 通常 希望 根据 数量 上 的 关系 对 系统 建 模 。 例 如 ， 我 们 之 前 考虑 过 理想 气 
体 定律 ， 它 通过 波 尔 座 曼 常数 k 关联 了 理想 气体 的 气压 p ， 体 积 v ， 数 量 n 以 及 温度 t 。 


DV 


这 样 一 个 方程 并 不 是 单方 向 的 。 给 定 任何 四 个 数量 ， 我 们 可 以 使 用 这 个 方程 来 计算 第 五 个 。 
但 将 这 个 方程 翻译 为 某 种 传统 的 计算 机 语言 会 强迫 我 们 选择 一 个 数量 ， 根 据 其 余 四 个 计算 出 
来 。 所 以 计算 气压 的 函数 应 该 不 能 用 于 计算 温度 ， 即 使 二 者 的 计算 通过 相同 的 方程 完成 。 

这 一 节 中 ， 我 们 从 零 开 始 设 计 线 性 计算 的 通用 模型 。 我 们 定义 了 数量 之 间 的 基本 约束 ， 例 
如 adder(a，b，c) 会 严格 保证 数学 关系 a+b=c。 

我 们 也 定义 了 组 合 的 手段 ， 使 基本 约束 可 以 被 组 合 来 表达 更 复杂 的 关系 。 这 样 ， 我 们 的 程序 
就 像 一 种 编程 语言 。 我 们 通过 构造 网 络 来 组 合约 束 ， 其 中 约束 由 连接 器 连接 。 连 接 器 是 一 种 
对 象 ， 它 “ 持 有 ”一 个 值 ， 并且 可 能 会 参与 一 个 或 多 个 约束 。 

例如 ， 我 们 知道 华氏 和 摄氏 温度 的 关系 是 : 


Oc DD (Ff 32) 


这 个 等 式 是 c 和 f 之 间 的 复杂 约束 。 这 种 约束 可 以 看 做 包 
含 adder 、 multiplier 和 contant 约束 的 网 络 。 


celsius a a 19 
全 6 + Cfahrenheit 
b b 





| 
9 5 32 
这 张 图 中 ， 我 们 可 以 看 到 ， 左 边 是 一 个 带 有 三 个 终端 的 乘法 器 盒子 ， 标 记 为 a，b 和 cc。 
它们 将 乘法 器 连接 到 网 络 剩 余 的 部 分 : 终端 a 链接 到 了 连接 器 celsius 上 ， 它 持 有 摄氏 温 
度 。 终 端 b 链接 到 了 连接 器 w 上 ，w 也 链接 到 持 有 9 的 盒子 上 。 终 端 c ， 被 乘法 器 盒子 约 


束 为 a 和 b 的 乘积 ， 链 接 到 另 一 个 乘法 器 盒子 上 ， 它 的 b 链接 到 常数 5 上 ， 以 及 它 的 a 连 
接 到 了 求 和 约束 的 一 项 上 。 


lx yf 





这 个 网 络 上 的 计算 会 如 下 进行 : 当 连 接 器 被 提供 一 个 值 时 (被 用 户 或 被 链接 到 它 的 约束 

器 ) ， 它 会 唤醒 所 有 相关 的 约束 (除了 刚刚 唤醒 的 约束 ) 来 通知 它们 它 得 到 了 一 个 值 。 每 个 
唤醒 的 约束 之 后 会 调查 它 的 连接 器 ， 来 看 看 是 否 有 足够 的 信息 来 为 连接 器 求 出 一 个 值 。 如 果 
可 以 ， 盒 子 会 设置 这 个 连接 器 ， 连 接 器 之 后 会 唤醒 所 有 相关 的 约束 ， 以 此 类 推 。 例 如 ， 在 摄 
氏 温 度 和 华氏 温度 的 转换 中 ，w 、x 和 y 会 被 常量 盒子 9 、 5 和 32 立即 设置 。 连 接 器 会 
唤醒 乘法 器 和 加 法 器 ， 它 们 判断 出 没有 足够 的 信息 用 于 处 理 。 如 果 用 户 〈 或 者 网 络 的 其 它 部 


分 ) 将 celsis 连接 器 设置 为 某 个 值 ( 比如 25 ) ， 最 左边 的 乘 ; 法 器 会 被 唤醒 ， 之 后 它 会 
将 u 设置 为 25 * 9 = 225 。 之 后 u 会 唤醒 第 二 个 乘法 器 ， 它 会 将 v 设置 为 45 ， 之 后 v 会 
唤醒 加 法 器 ， 它 将 fahrenheit 连接 器 设置 为 77 。 


使 用 约束 系统 。 为 了 使 用 约束 系统 来 计算 出 上 面 所 描述 的 温度 计算 ， 我 们 首先 创建 了 两 个 具 


名 连接 器 ” celsius 和 fahrenheit ， 通过 调用 make_connector 构造 器 8 


>>> celsius = make_connector('Celsius') 
>>> fahrenheit = make_connector('Fahrenheit') 


之 后 ， 我 们 将 这 些 连 接 器 链接 到 网 络 中 ， 这 个 网 络 反 映 了 上 面 的 图 示 。 哆 
数 make_converter 组 装 了 网 络 中 不 同 的 连接 器 和 约束 : 


>>>°defnmakemconvertern(comn te)s 
-Gonnect ctonf wathreoonstrarnts to convere tromoelsius to Fanmenhert 
U, Vv, WwW, x, y = [make_connector() for in range(5)] 
multiplier(c, w, u) 
multiplier(v, x, u) 
adder(v, y, f) 
constant(w, 9) 
constant (x, 5) 
constant(y, 32) 
>>> make_converter(celsius, fahrenheit) 


我 们 会 使 用 消息 传递 系统 来 协调 约束 和 连接 器 。 我 们 不 会 使 用 函数 来 响应 消息 ， 而 是 使 用 字 
典 。 用 于 分 发 的 字典 拥有 字符 串 类 型 的 键 ， 代 表 它 接受 的 消息 。 这 些 键 关联 的 值 是 这 些 消息 
的 响应 。 


约束 是 不 带 有 局 部 状态 的 字典 。 它 们 对 消息 的 响应 是 非 纯 函数 ， 这 些 函 数 变 所 约束 的 连 
接 器 

连接 器 是 一 个 字典 ， 持 有 当前 值 并 响应 操作 该 值 的 消息 。 约 束 不 会 直接 改变 连接 器 的 值 ， 而 
是 会 通过 发 送 消息 来 改变 ， 于 是 连接 器 可 以 提醒 其 他 约束 来 响应 变化 。 这 样 ， 连 接 器 代表 了 
一 个 数值 ， 同 时 封装 了 连接 器 的 行为 。 


我 们 可 以 发 送 给 连接 器 的 一 种 消息 是 设置 它 的 值 。 这 里 ， 我 们 ( 'user' ) 将 celsius 的 值 设 


>>>>celsiusl set Val |('user', 25) 
Celsius = 25 
Fahrenheit = 77.0 


不 仅仅 是 celsius 的 值 变 成 了 250 ? 它 的 值 也 在 网 络 上 传播 3 于 是 fahrenheit 的 值 也 发 生变 
化 。 这 些 变化 打印 了 出 来 ， 因 为 我 们 在 构造 这 两 个 连接 器 的 时 候 命名 了 它们 。 


现在 我 们 可 以 试 着 将 fahrenheit 设置 为 新 的 值 ， 比 如 212 。 


>>> fahrenheit['set_ val']('user', 212) 
Contradiction detected: 77.0 vs 212 


连接 器 报告 说 ， 它 察觉 到 了 一 个 矛盾 : 它 的 值 是 77.9 ， 但 是 有 人 尝试 将 其 设置 为 212 。 如 
果 我 们 真 的 想 以 新 的 值 复 用 这 个 网 络 ， 我 们 可 以 让 celsius 忘掉 旧 的 值 。 


>>> celsius['forget']('user') 
Celsius is forgotten 
Fahrenheit is forgotten 


连接 器 celsius 发 现 了 USer ， 一 开始 设置 了 它 的 值 2 现在 又 想 撤 销 这 个 值 2? 所 以 celsius 同 
意 丢 掉 这 个 值 ， 并且 通知 了 网 络 的 其 余部 分 。 这 个 消息 最 终 传播 给 fahrenheit ， 它 现在 发 现 
没有 理由 继续 相信 自己 的 值 为 77 。 于 是 ， 它 也 丢掉 了 它 的 值 。 


现在 fahrenheit 没有 值 了 ， 我 们 就 可 以 将 其 设置 为 212 


>>> fahrenheit['set_ val']('user', 212) 
Fahrenheit = 212 
Celsius = 100.0 


这 个 新 值 在 网 络 上 传播 ， 并 强迫 celsius 持 有 值 100 。 我 们 已 经 使 用 了 非常 相似 的 网 络 ， 提 
供 fahrenheit 来 计算 celsius ， 以 及 提供 celsius 来 计算 fahrenheit ° 这 个 无 方向 的 计算 就 
是 基于 约束 的 网 络 的 特征 。 


实现 约束 系统 。 像 我 们 看 到 的 那样 ， 连 接 器 是 字典 ， 将 消息 名 称 映射 为 函数 和 数据 值 。 我 们 
将 要 实现 响应 下 列 消息 的 连接 器 : 


® connector['set val'](source, value) 表示 source 请 求 连接 器 将 当 前 值 设 置 为 该 值 。 
© connector['has_val']() 返回 连接 器 是 否 已 经 有 了 一 个 值 。 

® connector['val'] 是 连接 器 的 当前 值 8 

© connector['forget'](source) 告诉 连接 器 ， source 请 求 它 忘掉 当 前 值 8 


©® connector['connect'](source) 告诉 连接 器 参与 新 的 约束 source ° 
约束 也 是 字典 ， 接 受 来 自 连 接 器 的 以 下 两 种 消息 : 


© constraint['new_ val']() 表示 连接 到 约束 的 连接 器 有 了 新 的 值 。 
® constraint['forget']() 表示 连接 到 约束 的 连接 器 需要 忘掉 它 的 值 。 
当 约 束 收 到 这 些 消息 时 ， 它 们 适当 地 将 它们 传播 给 其 它 连接 器 。 
adder 函数 在 两 个 连接 器 上 构造 了 加 法 器 约束 ， 其 中 前 两 个 连接 器 必须 加 到 第 三 个 
上 :a+b=c。 为 了 支持 多 方向 的 约束 传播 ， 加 法 器 必须 也 规定 从 c 中 减 去 a 会 得 
到 b ， 或 者 从 c 中 减 去 b 会 得 到 a 。 


>>> from operator Import add, sub 
>>> def adder(a, b, c): 
"Tnemeconstraunt tna a tb es 
return make_ternary_constraint(a, b, c, add, sub, sub) 


我 们 希望 实现 一 个 通用 的 三 元 (三 个 方向 ) 约束 ， 它 使 用 三 个 连接 器 和 三 个 函数 来 创建 约 
束 ， 接受 new_val 和 forget 消 息 。 消 息 的 响应 是 局 部 函数 ， 它 放 在 叫做 constraint 的 字典 
中 。 


>>>°def makemternary eonstranmnt(a Dc ab ca choy: 
"Thne constraunmt that rab(anb)=evandica(erad=bvandreb(eyb) an 
def new_value() : 
av, bv, cv = [connector[ 'has_val']() for connector in (a, b, c)] 
if av and bv: 
c['set_val'](constraint，ab(a['val']，b['val'])) 
elif av and cv: 
b['set_val'](constrajint，ca(c[' val']，a[' val'])) 
el bv andeeves 
a['set_val'](constraint, cb(c['val'], b['val'])) 
def forget value(): 
for connector in (a, b, c): 
connector['forget'](constraint) 
constraint = {'new val': new value, 'forget': forget_value} 
for connector in (a, b, c): 
connector['connect'](constraint) 
return constraint 


叫做 constraint 的 字典 是 个 分 发 字典 > 也 是 约束 对 象 自 身 o 它 响 应 两 种 约束 接收 到 的 消 息 2 
也 在 对 连接 器 的 调用 中 作为 source 参数 传递 。 


无 论 约束 什么 时 候 被 通知 ， 它 的 连接 器 之 一 拥有 了 值 ， 约 束 的 局 部 函数 new_value 都 会 被 调 
用 。 这 个 函数 首先 检查 是 否 a 和 bp 都 拥有 值 ， 如 果 是 这 样 ， 它 告诉 c 将 值 设 为 函数 ab 的 返 
回 值 ， 在 adder 中 是 add 。 约 束 ， 也 就 是 adder 对 象 ， 将 自身 作为 source 参数 传递 给 连接 
器 。 如 果 a 和 b 不 同时 拥有 值 ， 约 束 会 检查 a 和 c ， 以 此 类 推 。 


如 果 约 束 被 通知 ， 连 接 器 之 一 忘掉 了 它 的 值 ， 它 会 请 求 所 有 连接 器 忘掉 它们 的 值 (只 有 由 约 
束 设置 的 值 会 被 扶正 去 掉 ) 。 


multiplier 与 adder 类 似 : 


>>> from operator import mul, truediv 
>>>>defmmulenplnena Do 
-Tnerconstraunmt thatea be 
return make_ternary_constraint(a, b, c, mul, truediv, truediv) 


常量 也 是 约束 ， 但 是 它 不 会 发 送 任何 消息 ， 因 为 它 只 包含 一 个 单一 的 连接 器 ， 在 构造 的 时 候 
会 设置 它 


>>> def constant(connector, value): 
"""The constraint that connector = Value 
constraint = {} 
connector['set val'](constraint, value) 
return constraint 


这 三 三 个 约束 足以 实现 我 们 的 温度 度 转 换 网 络 。 


表示 连接 器 。 连 接 器 表示 为 包含 一 个 值 的 字典 ， 但 是 同时 拥有 带 有 局 部 状态 的 响应 函数 。 
接 器 必须 跟踪 向 它 提供 当前 值 的 informant ， 以 及 它 所 参与 的 constraints 列表 。 


构造 器 make _connector 是 局 部 六 数 ， 用 于 设置 和 忘掉 值 ， 它 响应 来 自 约束 的 消息 心 


>>> def make_connector(name=None ) : 
"""A connector between constraints. 
informant = None 
constraints = [] 
def set value(source, value): 
nonlocal informant 
val = connector['val'] 
if val is None: 
informant, connector['val'] = source, value 
if name is not None: 


print(name, '=', value) 
inform all except(source, 'new val', constraints) 
else 
If val != Value : 


print('Contradiction detected:', val, 'vs', value) 
def forget value(source): 
nonlocal informant 
if informant == source: 
informant, connector['val'] = None, None 
if name is not None: 
print(name, 'is forgotten') 
inform all except(source, 'forget', constraints) 
connector = {'val': None, 
'set_val': set_value, 
'forget': forget_value, 
'has_val': lambda: connector['val'] is not None, 
'connect': lambda source: constraints.append(source)} 
return connector 


。 前 四 个 


mY 


同时 ， 连 接 器 是 一 个 分 必 字 由 ， 用 于 分 发 五 个 消息 ， 约 束 使 用 它们 来 和 连接 器 通 1 
一 个 


局 部 函数 set_value 在 请 求 设置 连接 器 的 值 时 被 调用 w 如 果 连 接 器 当 前 并 没有 值 ， 它 会 会 设置 
该 值 并 将 informant 记 为 请 Be 该 值 的 source 约束 。 之 后 连接 器 会 提醒 所 有 参与 的 约束 ， 
除了 请 求 设置 该 值 的 约束 。 这 通过 使 用 下 列 和 迭代 函数 来 完成 。 


>>>"defr riniormiainexecent(source message ,conseraantsy): 
-nhonrmalk eonstraamts ofnthnelmessagqer excent sourcers 
for c in constraints: 
if c != source: 
c[message]() 


如 果 一 个 连接 器 被 请 求 忘掉 它 的 值 ， 它 会 调用 局 部 函数 forget_value ， 这 个 函数 首先 执行 检 
查 ， 来 确保 请 求 来 自 之 前 设置 该 值 的 同一 个 约束 。 如 果 是 的 话 ， 连 接 器 通知 相关 的 约束 来 丢 
掉 当 前 值 。 


对 has_val 消 息 的 响应 表示 连接 器 是 否 拥 有 一 个 值 。 对 connect 消息 的 响应 将 source 约束 添 
加 到 约束 列表 中 。 


我 们 设计 的 约束 程序 引入 了 许多 出 现在 面向 对 象 编 程 的 概念 。 约 束 和 连接 器 都 是 抽象 ， 它 们 
通过 消息 来 操作 。 当 连接 器 的 值 由 消息 改变 时 ， 消 息 不 仅仅 改变 了 它 的 值 ， 还 对 其 验证 ( 检 
查 来 源 ) 并 传播 它 的 影响 。 实 际 上 ， 在 这 一 章 的 后 面 ， 我 们 会 使 用 相似 的 字符 串 值 的 字典 结 
构 和 函数 值 来 实现 面向 对 象 系统 。 


2.5 面向 对 象 编程 


来 源 : 2.5 Object-Oriented Programming 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


面向 对 象 编程 (OOP) 是 一 种 用 于 组 织 程序 的 方法 ， 它 组 合 了 这 一 章 引 入 的 许多 概念 。 就 像 
抽象 数据 类 型 那样 ， 对 象 创建 了 数据 使 用 和 实现 之 间 的 抽象 界限 。 类 似 消息 传递 中 的 分 发 字 
典 ， 对 象 响 应 行为 请 求 。 就 像 可 变 的 数据 结构 ， 对 象 拥有 局 部 状态 ， 并 且 不 能 直接 从 全 局 环 
境 访问 。Python 对 象 系统 提供 了 新 的 语法 ， 更 易于 为 组 织 程序 实现 所 有 这 些 实用 的 技巧 。 


但 是 对 象 系统 不 仅仅 提供 了 便利 ; 它 也 为 程序 设计 添加 了 新 的 隐喻 ， 其 中 程序 中 的 几 个 部 分 
彼此 交互 。 每 个 对 象 将 局 部 状态 和 行为 绑 定 ， 以 一 种 方式 在 数据 抽象 背后 隐藏 二 者 的 复杂 
性 。 我 们 的 约束 程序 的 例子 通过 在 约束 和 连接 器 之 前 传递 消息 ， 产生 了 这 种 隐喻 。Python 对 
象 系统 使 用 新 的 途径 扩展 了 这 种 隐喻 ， 来 表达 程序 的 不 同 部 分 如 何 互 相关 联 ， 以 及 互相 通 
信 。 对 象 不 仅仅 会 传递 消息 ， 还 会 和 其 它 相 同类 型 的 对 象 共享 行为 ， 以 及 从 相关 的 类 型 那里 
继承 特性 。 


面向 对 象 编程 的 范式 使 用 自己 的 词汇 来 强化 对 象 隐 喻 。 我 们 已 经 看 到 了 “， 对 象 是 拥有 方法 和 
属性 的 数据 值 ， 可 以 通过 点 运算 符 来 访问 。 每 个 对 象 都 拥有 一 个 类 型 ， 叫 做 类 。Python 中 可 
以 定义 新 的 类 ， 就 像 定义 函数 那样 。 


2.5.1 对 象 和 类 


类 可 以 用 作 所 有 类 型 为 该 类 的 对 象 的 模板 。 每 个 对 象 都 是 某 个 特定 类 的 实例 。 我 们 目前 使 用 
的 对 象 都 拥有 内 建 类 型 ， 但 是 我 们 可 以 定义 新 的 类 ， 就 像 定义 函数 那样 。 类 的 定义 规定 了 在 
该 类 的 对 象 之 间 共 享 的 属性 和 方法 。 我 们 会 通过 重新 观察 银行 账户 的 例子 ， 来 介绍 类 的 语 
名 。 


在 介绍 局 部 状态 时 ， 我 们 看 到 ， 银 行 账户 可 以 自然 地 建 模 为 拥有 balance 的 可 变 值 。 银 行 账 
户 对 象 应 该 拥有 withdraw 方法 ， 在 可 用 的 情况 下 ， 它 会 更 新 账户 余额 ， 并 返回 所 请 求 的 金 

额 。 我 们 希望 添加 一 些 额 外 的 行为 来 完善 账户 抽象 : 银行 账户 应 该 能 够 返回 它 的 当前 余额 ， 
返回 账户 持 有 者 的 名 称 ， 以 及 接受 存款 。 


Account 类 允许 我 们 创建 银行 账户 的 多 个 实例 。 创 建新 对 象 实例 的 动作 被 称 为 实例 化 该 类 。 
Python 中 实例 化 茶 个 类 的 语法 类 似 于 函数 的 调用 语句 。 这 里 ， 我 们 使 用 参数 'Jim' (账户 持 
有 者 的 名 称 ) 来 调用 Account 0° 


>>> a = Account('Jim') 


对 象 的 属性 是 和 对 象 关 联 的 名 值 对 ， 它 可 以 通过 点 运算 符 来 访问 。 属 性 特定 于 具体 的 对 象 ， 
而 不 是 类 的 所 有 对 得 ， 也 叫做 实例 属性 。 每 个 Account 对 象 都 拥有 自己 的 余额 和 账户 持 有 者 
名 称 ， 它 们 是 实例 属性 的 一 个 例子 。 在 更 宽泛 的 编程 社 群 中 ， 实 例 属 性 可 能 也 叫做 字段 、 属 
隆 或 者 实例 变量 。 


>>> a.holder 
mi 

>>> a.balance 
0 


操作 对 象 或 执行 对 象 特定 计算 的 函数 叫做 方法 。 方 法 的 副作用 和 返回 值 可 能 依赖 或 改变 对 象 
的 其 它 属性 。 例 如 ， deposit 是 Account 对 象 a 上 的 方法 。 它 接受 一 个 参数 ， 即 需要 存 入 的 
金额 ， 修 改 对 象 的 balance 属性 ， 并 返回 产生 的 余额 。 


>>> a.deposit(15) 
5 


在 OOP 中 ， 我 们 说 方法 可 以 在 特定 对 象 上 调用 。 作 为 调用 withdraw 方法 的 结果 ， 要 么 取 钱 
成 功 ， 余 额 减少 并 返回 ， 要 么 请 求 被 拒绝 ， 账 户 打 印 出 错误 信息 。 


>>> a.withdraw(10) # The withdraw method returns the balance after withdrawal 
5S 

>>> a.balance # The balance attribute has changed 

S 


>>> a.withdraw(10) 
'Insufficient funds' 


像 上 面 展 示 的 那样 ， 方 法 的 行为 取决 于 对 象 属性 的 改变 。 两 次 以 相同 参数 对 withdraw 的 调用 
返回 了 不 同 的 结果 。 


2.5.2 类 的 定义 


用 户 定义 的 类 由 class 语句 创建 ， 它 只 包含 单个 子 句 。 类 的 语句 定义 了 类 的 名 称 和 基 类 (会 
在 继承 那 一 节 讨 论 ) ， 之 后 包含 了 定义 类 属性 的 语句 组 : 


class <name>(<base class>): 
<suite> 


当 类 的 语句 被 执行 时 ， 新 的 类 会 被 创建 ， 并 且 在 当前 环境 第 一 帧 绑 定 到 <name> 上 。 之 后 会 执 
行 语 名 组 权 任何 名 称 都 会 在 class 语句 的 <SUite> 中 绑 定 有 通过 def 或 赋值 语句 2 创建 或 修 
改 类 的 属性 。 


围绕 实例 属性 来 组 织 ， 实 例 属 性 是 名 值 对 ， 不 和 类 本 身 关 联 但 和 类 的 每 个 对 象 关联 。 


类 通常 
通过 为 实例 化 新 对 象 定义 方法 ， 类 规定 了 它 的 对 象 的 实例 属性 。 


通 


class 语句 的 <suite> 部 分 包含 def 语句 ， 它 们 为 该 类 的 对 象 定 义 了 新 的 方法 。 用 于 实例 化 
对 象 的 方法 在 Python 中 拥有 特殊 的 名 称 ，_init  ( init 两 边 分 别 有 两 个 下 划 线 ) ， 它 叫 
做 类 的 构造 器 。 


>>> class Account(object ) : 
def nitoe (self, accounte holder): 
self.balance = 0 
self.holder = account_holder 


Account 的 _ init 方法 有 两 个 形 参 。 第 一 个 是 self ， 绑 定 到 新 创建 的 Account 对 象 上 。 
第 二 个 参数 ， account_holder ， 在 被 调用 来 实例 化 的 时 候 ， 绑 定 到 传 给 该 类 的 参数 上 。 


构造 器 将 实例 属性 名 称 balance 与 6 绑 定 。 它 也 将 属性 名 称 holder 绑 定 

到 account_holder 上 。 形 参 account_holder 是 __ init 方法 的 局 部 名 称 9 另 一 方面 2 通过 最 
后 一 个 赋值 语 句 绑 定 的 名 称 holder 是 一 直 存 在 的 ， 因为 它 使 用 点 运算 符 被 存储 为 self 的 属 

性 0° 


定义 了 Account 类 之 后 ， 我 们 就 可 以 实例 化 它 : 


>>> a = Account('Jim') 


这 个 对 Account 类 的 “调用 ”创建 了 新 的 对 象 ， 它 是 Account 的 实例 ， 之 后 以 两 个 参数 调用 了 构 
造 函 数 _ init  : 新 创建 的 对 象 和 字符 串 'Jim! 。 按 照 惯 例 ， 我 们 使 用 名 称 self 来 命名 构 
造 器 的 第 一 个 参数 ， 因 为 它 绑 定 到 了 被 实例 化 的 对 象 上 。 这 个 惯例 在 几乎 所 有 Python 代码 中 
都 适用 。 


现在 ， 我 们 可 以 使 用 点 运算 符 来 访问 对 象 的 balance 和 holder 。 


>>> a.balance 
0 

>>> a.holder 
my 


身份 。 每 个 新 的 账户 实例 都 有 自己 的 余额 属性 ， 它 的 值 独立 于 相同 类 的 其 它 对 象 。 


>>> b = Account('Jack') 

>>> b.balance = 200 

>>> [acc.balance for acc in (a, b)] 
[9，200] 


为 了 强化 这 种 隔离 ， 每 个 用 户 定 义 类 的 实例 对 象 都 有 个 独特 的 身份 。 对 象 身 份 使 


用 is 和 is not 运算 符 来 比较 。 


>>> a is a 
True 

>>>°aP Snoeb 
True 


虽然 由 同一 个 调用 来 构造 ， 绑 定 到 a 和 b 的 对 象 并 不 相同 。 通 常 ， 使 用 赋值 将 对 象 绑 定 到 新 
名 称 并 不 会 创建 新 的 对 象 。 


>>> C = a 
>>> C is a 
True 


用 户 定义 类 的 新 对 人 象 只 在 类 (比如 Account ) 使 用 调用 表达 式 被 实例 化 的 时 候 创建 。 


方法 。 对 象 方法 也 由 class 语句 组 中 的 def 语 名 定义。 下 面 ， deposit 和 withdraw 都 被 定义 
为 Account 类 的 对 象 上 的 方法 : 


>>> Class Account(object ) : 

def nit (self, acecount holder): 
self.balance = 0 
self.holder = account_holder 

def deposit(self, amount): 
self.balance = Self.balance + amount 
return self.balance 

def withdraw(self, amount): 
if amount > self.balance: 

return 'Insufficient funds' 

self.balance = Self.balance - amount 
return self.balance 


虽然 方法 定义 和 函数 定义 在 声明 方式 上 并 没有 区 别 ， 方 法 定义 有 不 同 的 效果 。 由 class 语句 
中 的 def 语 多 创建 的 函数 值 绑 定 到 了 声明 的 名 称 上 ， 但 是 只 在 类 的 局 部 绑 定 为 一 个 属性 。 这 
个 值 可 以 使 用 点 运 草 符 在 类 的 实例 上 作为 方法 来 调用 。 


每 个 方法 定义 同样 包含 特殊 的 首 个 参数 self ， 它 绑 定 到 方法 所 调用 的 对 象 上 。 例 如 ， 让 我 们 
假设 deposit 在 特定 的 Account 对 象 上 调用 ， 并 且 传 递 了 一 个 对 象 值 : 要 存 入 的 金额 。 对 象 
本 身 绑 定 到 了 self 上 ， 而 参数 绑 定 到 了 amount 上 。 所 有 被 调用 的 方法 能 够 通过 self 参数 
来 访问 对 象 ， 所 以 它们 可 以 访问 并 操作 对 象 的 状态 。 


为 了 调用 这 些 方法 ， 我 们 再 次 使 用 点 运算 符 ， 就 像 下 面 这 样 : 


>>> tom_account = Account( Tom ') 
>>> tom_account .deposit(100 ) 


>>> tom_account ,withdraw(90) 
>>> tom_account ,withdraw(90) 
"Insufficient funds' 


>>> tom account.holder 
nen 


当 一 个 方法 通过 点 运算 符 调 用 时 ， 对 象 本 身 〈 这 个 例子 中 绑 定 到 了 tom_account ) 起 到 了 双重 
作用 。 首 先 ， 它 决定 了 withdraw 意味 着 哪个 名 称 ; withdraw 并 不 是 环境 中 的 名 称 ， 而 

是 Account 类 局 部 的 名 称 。 其 次 ， 当 withdraw 方法 调用 时 ， 它 绑 定 到 了 第 一 个 参 

数 self 上 。 求 解 点 运算 符 的 详细 过 程 会 在 下 一 节 中 展示 。 


2.5.3 消息 传递 和 点 表达 式 


方法 定义 在 类 中 ， 而 实例 属性 通常 在 构造 器 中 赋值 ， 二 者 都 是 面向 对 象 编程 的 基本 元 素 。 这 
两 个 概念 很 大 程度 上 类 似 于 数据 值 的 消息 传递 实现 中 的 分 发 字典 。 对 象 使 用 点 运算 符 接受 消 
息 ， 但 是 消息 并 不 是 任意 的 、 值 为 字符 串 的 键 ， 而 是 类 的 局 部 名 称 。 对 象 也 拥有 具名 的 局 部 
状态 值 (实例 属性 ) ， 但 是 这 个 状态 可 以 使 用 点 运算 符 访问 和 操作 ， 并 不 需要 在 实现 中 使 


用 nonlocal 语句 


消息 传递 的 核心 概念 ， 就 是 数据 值 应 该 通过 响应 消息 而 拥有 行为 ， 这 些 消息 和 它们 所 表示 的 
抽象 类 型 相关 。 点 运算 符 是 Python 的 语法 特征 ， 它 形成 了 消息 传递 的 隐喻 。 使 用 带 有 内 建 对 
象 系统 语言 的 优点 是 ， 消 息 传递 能 够 和 其 它 语言 特性 ， 例 如 赋值 语句 无 颖 对接。 我 们 并 不 需 
要 不 同 的 消息 来 “获取 ”和 “设置 "关联 到 局 部 属性 名 称 的 值 ; 语言 的 语法 允许 我 们 直接 使 用 消息 
名 称 。 


点 表达 式 。 类 似 tom_account , deposit 的 代码 片段 叫做 点 表达 式 9 点 表达 式 包含 一 个 表达 式 > 
一 个 点 和 一 个 名 称 : 


<expression> . <nNname> 


<expression> 可 为 任意 的 Python 有 效 表达 式 ， 但 是 <name> 必须 是 个 简单 的 名 称 (而 不 是 求 
值 为 name 的 表达 式 ) 。 点 表达 式 会 使 用 提供 的 <name> ， 对 值 为 <expression> 的 对 象 求 出 属 
性 的 值 。 


内 建 的 函数 getattr 也 会 按 名 称 返 回 对 象 的 属性 。 它 是 等 价 于 点 运算 符 的 函数 。 使 
用 getattr ， 我 们 就 能 使 用 字符 串 来 查找 某 个 属性 3 就 像 分 发 字典 那样 : 


>>> getattr(tom account, 'balance') 
10 


我 们 也 可 以 使 用 hasattr 测试 对 象 是 否 拥有 某 个 具名 属性 : 


>>> hasattr(tom account, "deposit ' ) 
True, 


对 象 的 属性 包含 所 有 实例 属性 ， 以 及 所 有 定义 在 类 中 的 属性 (包括 方法 ) 。 方 法 是 需要 特别 
处 理 的 类 的 属性 。 


方法 和 函数 。 当 一 个 方法 在 对 和 象 上 调用 时 ， 对 象 隐 式 地 作为 第 一 个 参数 传递 给 方法 。 也 就 是 
说 ， 点 运算 符 左 边 值 为 <expression> 的 对 象 ， 会 自 动 传 给 点 运算 符 右 边 的 方法 ， 作 为 第 一 个 
参数 。 所 以 ， 对 象 绑 定 到 了 参数 self 上 。 


为 了 自动 实现 self 的 绑 定 ，Python 区 分 元 数 和 绑 定 方法 。 我 们 已 经 在 这 门 课 的 开始 创建 了 
前 者 ， 而 后 者 在 方法 调用 时 将 对 象 和 部 数组 合 到 一 起 。 绑 定 方 法 的 值 已 经 将 第 一 个 函数 关联 
到 所 调用 的 实例 ， 当 方法 调用 时 实例 会 被 命名 为 self 。 


通过 在 点 运算 符 的 返回 值 上 调用 type ， 我 们 可 以 在 交互 式 解 释 器 中 看 到 它们 的 差异 。 作 为 类 
的 属性 ， 方 法 只 是 个 函数 ， 但 是 作为 实例 属性 ， 它 是 绑 定 方法 : 


>>> type(Account ,deposit ) 
<class 'function'> 

>>> type(tom account.deposit) 
<class 'method'> 


个 结果 的 唯一 不 同 点 是 ， 前 者 是 个 标准 的 二 元 函数 ， 带 有 参数 self 和 amount 。 后 者 是 
一 元 方法 ， 当 方法 被 调用 时 ， 名 称 self 自动 绑 定 到 了 名 为 tom account 的 对 象 上 ， 而 名 
称 amount 会 被 绑 定 到 传递 给 方法 的 参数 上 。 这 两 个 值 ， 无 论 函 数值 或 绑 定 方法 的 值 ， 都 和 相 
同 的 deposit 函数 体 所 关联 。 


我 们 可 以 以 两 种 方式 调用 deposit : 作为 函数 或 作为 绑 定 方法 。 在 前 者 的 例子 中 ， 我 们 必须 
为 self 参数 显 式 提供 实 参 。 而 对 于 后 者 ， self 参数 已 经 自动 绑 定 了 。 


>>> Account .deposit(tom account, 1001) # The deposit function requires 2 arguments 
二 0 也 

>>> tom _ account.deposit(1000) # The deposit method takes 1 argument 

AO 


函数 getattr 的 表现 就 像 运 算 符 那 样 : 它 的 第 一 个 参数 是 对 象 ， 而 第 二 个 参数 (名称) 是 定 
义 在 类 中 的 方法 。 之 后 ， getattr 返回 绑 定 方法 的 值 。 另 一 方面 ， 如 果 第 一 个 参数 是 个 
类 ， getattr 会 直接 返回 属性 值 ， 它 仅仅 是 个 函数 。 


实践 指南 : 命名 惯例 。 类 名 称 通 常 以 首 字 母 大 写 来 编写 (也 叫 作 了 驼峰 拼写 法 ， 因 为 名 称 中 间 
的 大 写字 母 像 驼峰 ) 。 方 法 名 称 遵循 函数 命名 的 惯例 ， 使 用 以 下 划 线 分 隔 的 小 写字 母 。 


有 的 时 候 ， 有 些 实例 变量 和 方法 的 维护 和 对 象 的 一 致 性 相关 ， 我 们 不 想 让 用 户 看 到 或 使 用 它 
们 。 它 们 并 不 是 由 类 定义 的 一 部 分 抽象 ， 而 是 一 部 分 实现 。Python 的 惯例 规定 ， 如 果 属 性 名 
称 以 下 划 线 开始 ， 它 只 能 在 方法 或 类 中 访问 ， 而 不 能 被 类 的 用 户 访问 。 


2.5.4 关 属 性 


有 些 属 性 值 在 特定 类 的 所 有 对 象 之 间 共 享 。 这 样 的 属性 关联 到 类 本 身 ， 而 不 是 类 的 任何 独立 
实例 。 例 如 ， 让 我 们 假设 银行 以 国定 的 利率 对 余额 支付 利息 。 这 个 利率 可 能 会 改变 ， 但 是 它 
是 在 所 有 账户 中 共享 的 单一 值 。 

类 属性 由 class 语句 组 中 的 赋值 语句 创建 ， 位 于 任何 方法 定义 之 外 。 在 更 宽泛 的 开发 者 社 群 
中 ， 类 属性 也 被 叫做 类 变量 或 静态 变量 。 下 面 的 类 语句 以 名 称 interest 为 Account 创建 了 类 
属性 。 


>>> class Account(object ) : 
interest = 0.02 # A class attribute 
de neemi(seLlrt .accounta nolden)e 
self.balance = 0 
self.holder = account_holder 
# Additional methods would be defined here 


个 属性 仍旧 可 以 通过 类 的 任何 实例 来 访问 。 


>>> tom_account = Account( Tom ') 
>>> jim_account = Account( ' Jim') 
>>> tom_account ,interest 

0.02 

>>> jim _ account.interest 

Qa02 


但 是 ， 对 类 属性 的 单一 赋值 语句 会 改变 所 有 该 类 实例 上 的 属性 值 


>>> Account .Interest = 0.04 
>>> tom_account ,Interest 
0.04 

>>> jim_account.interest 
0.04 


属性 名 称 。 我 们 已 经 在 我 们 的 对 象 系统 中 引入 了 足够 的 复杂 性 ， 我 们 需要 规定 名 称 如 何 解 析 
为 特定 的 属性 。 毕 竞 ， 我 们 可 以 轻易 拥有 同名 的 类 属性 和 实例 属性 。 


像 我 们 看 到 的 那样 ， 点 运算 符 由 表达 式 、 点 和 名 称 组 成 : 


<expression> . <name> 


为 了 求解 点 表达 式 : 


1. 求 出 点 左边 的 <expression> ， 会 产生 点 运算 符 的 对 办 。 

2. <name> 会 和 对 象 的 实例 属性 匹配 ; 如 果 该 名 称 的 属性 存在 ， 会 返回 它 的 值 。 

3， 加 采 轩 个 广 在 实例 属性 ， 财 么 会 在 类 中 要 机 DDI， 这 会 广 生 类 的 局 性 值 。 
4.， 这 个 值 会 被 返回 ， 如 果 它 是 个 函数 ， 则 会 返回 绑 定 方法 。 


这 个 求 值 过 程 中 ， 实 例 属 性 在 类 的 属性 之 前 查找 ， 就 像 局 部 名 称 具有 高 于 全 局 的 优先 级 。 
定义 在 类 中 的 方法 ， 在 求 值 过 程 的 第 三 步 绑 定 到 了 点 运算 符 的 对 象 上 。 在 类 中 查找 名 称 的 过 
程 有 额外 的 差异 ， 在 我 们 引入 类 继承 的 时 候 就 会 出 现 。 


赋值 。 所 有 包含 点 运算 符 的 赋值 语句 都 会 作用 于 右边 的 对 象 。 如 果 对 象 是 个 实例 ， 那 么 赋值 
就 会 设置 实例 属性 。 如 果 对 象 是 个 类 ， 那 么 赋值 会 设置 类 属性 。 作 为 这 条 规则 的 结果 ， 对 对 
象 属性 的 赋值 不 能 影响 类 的 属性 。 下 面 的 例子 展示 了 这 个 区 别 。 


如 果 我 们 向 账户 实例 的 具名 属性 interest 赋值 ， 我 们 会 创建 属性 的 新 实例 ， 它 和 现 有 的 类 属 
性 具有 相同 名 称 。 


>>> jim_account ,interest = 0.08 


这 个 属性 值 会 通过 点 运算 符 返回 : 


>>> jim_account ,interest 
0.08 


但 是 ， 类 属性 interest 会 保持 为 原始 值 ， 它 可 以 通过 所 有 其 他 账户 返回 


>>> tom_account ,Interest 
0.04 


类 属性 interest 的 改动 会 影响 tom account ， 但 是 jim account 的 实例 属性 不 受 影响 。 


>>> Account ,interest = 0.05 # changing the class attribute 


>>> tom_account ,interest # changes instances without like-named instance attributes 
Qn05 

>>> jim_account , Interest sputethe exusting nstance attrubuten ns unattected 

0.08 


囊 | = | 


2.5.5 继承 


在 使 用 OOP 范式 时 ， 我 们 通常 会 发 现 ， 不 同 的 抽象 数据 结构 是 相关 的 。 特 别 是 ， 我 们 发 现 相 
似 的 类 在 特 化 的 程度 上 有 区 别 。 两 个 类 可 能 拥有 相似 的 属性 ， 但 是 一 个 表示 另 一 个 的 特殊 情 
况 。 


例如 ， 我 们 可 能 希望 实现 一 个 活期 账户 ， 它 不 同 于 标准 的 账户 。 活 期 账户 对 每 笔 取 款 都 收取 
额外 的 $1， 并 且 具 有 较 低 的 利率 。 这 里 ， 我 们 演示 上 述 行为 : 


>>> ch = CheckingAccount( Tom ') 


>>> ch.interest # Lower interest rate for checking accounts 
OL 

>>> ch.deposit(20) # Deposits are the same 

20 


>>> ch.withdraw(5) # withdrawals decrease balance by an extra charge 
14 


checkingAccount 是 Account 的 特 化 。 在 OOP 的 术语 中 ， 通 用 的 账户 会 作 
为 CheckingAccount 的 基 类 ， 而 CheckingAccount 是 Account 的 子 类 (术语 “ 父 类 ”和 “ 超 类 ”通常 
等 同 于 “ 基 类 ”, 而 “派生 类 ” 通 常 等 同 于 “ 子 类 ”) 


子 类 继承 了 基 类 的 属性 ， 但 是 可 能 履 盖 特定 属性 ， 包 括 特定 的 方法 。 使 用 继承 ， 我 们 只 需要 
关注 基 类 和 子 类 之 间 有 什么 不 同 。 任 何 我 们 在 子 类 未 指定 的 东西 会 自动 假设 和 基 类 中 相同 。 


继承 也 在 对 象 隐 喻 中 有 重要 作用 ， 不 仅仅 是 一 种 实用 的 组 织 方式 。 继 承 意味 着 在 类 之 间 表 
达 "is-a” 关 系 ， 它 和 “has-a” 关 系 相反 。 活 期 账户 是 (is-a) 一 种 特殊 类 型 的 账户 ， 所 以 

让 checkingAccount 继承 Account 是 继承 的 合理 使 用 。 另 一 方面 ， 银 行 拥有 (has-a) 所 管理 
的 银行 账户 的 列表 ， 所 以 二 者 都 不 应 继承 另 一 个 。 反 之 ， 账 户 对 象 的 列表 应 该 自然 地 表现 为 
银行 账户 的 实例 属性 。 


2.5.6 使 用 继承 


我 们 通过 将 基 类 放置 到 类 名 称 后 面 的 贺 括 号 内 来 指定 继承 。 首 先 ， 我 们 提供 Account 类 的 完 
整 实 现 ， 也 包含 类 和 方法 的 文档 字符 囊 。 


>>> class Account(object): 

"""A bank account that has a non-negative balance.""" 

interest = 0.02 

def init J/(self. account nolder): 
self.balance = 0 
self.holder = account_holder 

def ‘denosit(self ,amount)es 
"Tnerease thne raccount balance by amount andireturn the mnewbalances 
self.balance = Self.balance + amount 
return self.balance 

def withdraw(self, amount): 
"""Decrease the account balance by amount and return the new balance.™"™"" 
if amount > self.balance: 

return Insuffircnent funds 

self.balance = self.balance - amount 
return self.balance 


checkingAccount 的 完整 实现 在 下 面 : 


>>> class CheckingAccount(Account ) : 
"""A bank account that charges for withdrawals."™"" 
withdraw_charge = 1 
interest = 0.01 
def withdraw(self, amount): 
return Account .withdraw(self, amount + self.withdraw_ charge) 


这 里 ， 我 们 引入 了 类 属性 withdraw charge ， 它 特定 于 checkingAccount 类 。 我 们 将 一 个 更 低 
的 值 赋 给 interest 属性 。 我 们 也 定义 了 新 的 withdraw 方法 来 覆盖 定义 在 Account 对 象 中 的 
行为 。 类 语句 组 中 没有 更 多 的 语句 ， 所 有 其 它 行为 都 从 基 类 Account 中 继承 。 


>>> checking = CheckingAccount('Sam') 
>>> checking.deposit(10) 

10 

>>> checking.withdraw(5) 

4 

>>> checking.interest 

(OBLOR EL 


checking.deposit 表达 式 是 用 于 存款 的 绑 定 方法 ， 它 定义 在 Account 类 中 ， 当 Python 解析 点 
表达 式 中 的 名 称 时 ， 实 例 上 并 没有 这 个 属性 ， 它 会 在 类 中 查找 该 名 称 。 实 际 上 ， 在 类 中 “查找 
名 称 ” 的 行为 会 在 原始 对 象 的 类 的 继承 链 中 的 每 个 基 类 中 查找 。 我 们 可 以 北 归 定义 这 个 过 程 ， 
为 了 在 类 中 查找 名 称 : 


1.， 如 果 类 中 有 带 有 这 个 名 称 的 属性 ， 返 回 属性 值 。 
2. 否则 ， 如 果 有 基 类 的 话 ， 在 基 类 中 查找 该 名 称 。 


在 deposit 中 ，Python 会 首先 在 实例 中 查找 名 称 ， 之 后 在 checkingAccount 类 中 。 最 后 ， 它 
会 在 Account 中 查找 ， 这 里 是 deposit 定义 的 地 方 。 根 据 我 们 对 点 运算 符 的 求 值 规则 ， 由 

于 deposit 是 在 checking 实例 的 类 中 查找 到 的 函 数 ， 点 运算 符 求 值 为 绑 定 方法 。 这 个 方法 以 
参数 16 调用 ， 这 会 以 绑 定 到 checking 对 象 的 self 和 绑 定 到 16 的 amount 调用 deposit 方 
法 。 


对 象 的 类 会 始终 保持 不 变 。 即 使 deposit 方法 在 Account 类 中 找到 ， deposit 以 绑 定 
到 CheckingAccount 实例 的 self 调用 ， 而 不 是 Account 的 实例 。 


译 者 注 : checkingAccount 的 实例 也 是 Account 的 实例 ， 这 个 说 法 是 有 问题 的 。 


调用 祖先 。 被 覆盖 的 属性 仍然 可 以 通过 类 对 象 来 访问 。 例 如 ， 我 们 可 以 通过 以 包 
含 withdraw_charge 的 参数 调用 Account 的 withdraw 方法 ， 来 实 


现 CheckingAccount 的 withdraw 方法 。 


要 注意 我 们 调用 Self.withdraw_charge 而 不 是 等 价 的 CheckingAccount .withdraw_charge ° 前 者 
的 好 处 就 是 继承 自 checkingAccount 的 类 可 能 会 覆盖 支取 费用 。 如 果 是 这 样 的 话 ， 我 们 希望 我 
们 的 withdraw 实现 使 用 新 的 值 而 不 是 旧 的 值 。 


2.5.7 多 重 继 承 


Python 支持 子 类 从 多 个 基 类 继承 属性 的 概念 ， 这 是 一 种 叫做 多 重 继承 的 语言 特性 。 


假设 我 们 从 Account 继承 了 savingsAccount ， 每 次 存 钱 的 时 候 向 客户 收取 一 笔 小 费用 。 


>>> Class SavingsAccount(Account): 
deposit_charge = 2 
def deposit(self, amount): 
return Account.deposit(self, amount - self.deposit charge) 


之 后 ， 一 个 聪明 的 总 经 理 设 想 了 AsseenonTVAccount ， 它 拥 

有 checkingAccount 和 savingsAccount 的 最 佳 特性 : 支取 和 存 入 的 费用 ， 以 及 较 低 的 利率 。 它 
将 储 著 账户 和 活期 存款 账户 合 二 为 一 | “如 果 我 们 构建 了 它 ”， 总 经 理解 释 道 ，“ 一 些 人 会 注册 
并 支付 所 有 这 些 费 用 。 基 至 我 们 会 给 他 们 一 美元 。” 


>>> class AsSeenOnTVAccount(CheckingAccount, SavingsAccount): 
def Enitm(selft account nouden)e 
self.holder = account_holder 
self.balance = 1 # A free dollar! 


实际 上 ， 这 个 实现 就 完整 了 。 存 款 和 取款 都 需要 费用 ， 使 用 了 定义 
在 CheckingAccount 和 SavingsAccount 中 的 相应 函数 。 


>>> such_a deal = AsSeenOnTVAccount("John") 
>>> such_a_ deal.balance 


下 

>>> Such_a_deal,.deposit(290) # $2 fee from SavingsAccount ,deposit 
19 

>>> such_a_ deal.withdraw(5) # $1 fee from CheckingAccount .withdraw 
le 


就 像 预 期 那样 ， 没 有 歧义 的 引用 会 正确 解析 : 


>>> Such_a_deal.deposit_charge 
忆 

>>> such_a deal.withdraw_charge 
中 


但 是 如 果 引 用 有 歧义 呢 ， 比 如 withdraw 方法 的 引用 ， 它 定义 
在 Account 和 CheckingAccount 中 中 下 面 的 图 展示 了 AsSeenOnTVAccount 类 的 继承 图 。 每 个 入 
头 都 从 子 类 指向 基 类 。 


CheckingAccount| | SavingsAccount 


AsSeenOnTVAccount 


对 于 像 这 样 的 简单 “ 鞭 形 ”，Python 从 左 到 右 解 析 名 称 ， 之 后 向 上 。 这 个 例子 中 ，Python 按 下 
列 顺序 检查 名 称 ， 直 到 找到 了 具有 该 名 称 的 属性 : 


AsSeenOonTVAccount, CheckingAccount, SavingsAccount, Account, object 


继承 顺序 的 问题 没有 正确 的 解法 ， 因 为 我 们 可 能 会 给 某 个 派生 类 高 于 其 他 类 的 优先 级 。 但 
是 ， 任 何 支 持 多 重 继承 的 编程 语言 必须 始终 选择 同一 个 顺序 ， 便 于 语言 的 用 户 预测 程序 的 行 


扩展 阅读 。Python 使 用 一 种 叫做 C3 Method Resolution Ordering 的 递归 算法 来 解析 名 称 。 
任何 类 的 方法 解析 顺序 都 使 用 所 有 类 上 的 mro 方法 来 查询 。 


>>> [c,_ name _ for c in AsSeenOnTVAccount.mro()] 
['AsSeenonTVAccount', 'CheckingAccount', 'SavingsAccount', 'Account', 'object'] 


这 个 用 于 查询 方法 解析 顺序 的 莫 法 并 不 是 这 门 课 的 主题 ， 但 是 Python 的 原作 者 使 用 一 篇 原文 
章 的 引用 来 描述 它 。 


2.5.8 对 象 的 作用 


Python 对 象 系统 为 使 数据 抽象 和 消息 传递 更 加 便捷 和 灵活 而 设计 。 类 、 方 法 、 继 承 和 点 运算 
符 的 特 化 语法 都 可 以 让 我 们 在 程序 中 形成 对 象 隐喻 ， 它 能 够 提升 我 们 组 织 大 型 程序 的 能 力 。 


特别 是 ， 我 们 希望 我 们 的 对 象 系统 在 不 同 层面 上 促进 关注 分 离 。 每 个 程序 中 的 对 象 都 封装 和 
管理 程序 状态 的 一 部 分 ， 每 个 类 语句 都 定义 了 一 些 函 数 ， 它 们 实现 了 程序 总 体 逻 辑 的 一 部 
分 。 抽 象 界限 强制 了 大 型 程序 不 同 层面 之 间 的 边界 。 


面向 对 象 编程 适 合 于 对 系统 建 模 ， 这 些 系统 拥有 相互 分 离 并 交互 的 部 分 。 例 如 ， 不 同 用 户 在 
社交 网 络 中 互动 ， 不 同 角 色 在 游戏 中 互动 ， 以 及 不 同 图 形 在 物理 模拟 中 互动 。 在 表现 这 种 系 
统 的 时 候 ， 程 序 中 的 对 象 通常 自然 地 映射 为 被 建 模 系统 中 的 对 象 ， 类 用 于 表现 它们 的 类 型 和 
关系 。 

另 一 方面 ， 类 可 能 不 会 提供 用 于 实现 特定 的 抽象 的 最 佳 机 制 。 函 数 式 抽象 提供 了 更 加 自然 的 
隐喻 ， 用 于 表现 输入 和 输出 的 关系 。 一 个 人 不 应 该 强迫 自己 把 程序 中 的 每 个 细微 的 逻辑 都 塞 
到 类 里 面 ， 尤 其 是 当 定义 独立 函数 来 操作 数据 变 得 十 分 自然 的 时 候 。 函 数 也 强制 了 关注 分 
离 o 

类 似 Python 的 多 范式 语言 允许 程序 员 为 合适 的 问题 匹配 合适 的 范式 。 为 了 简化 程序 ， 或 使 程 
序 模块 化 ， 确 定 何 时 引入 新 的 类 ， 而 不 是 新 的 函数 ， 是 软件 工程 中 的 重要 设计 技巧 ， 这 需要 
仔细 关注 。 


2.6 实现 类 和 对 象 


来 源 : 2.6 Implementing Classes and Objects 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


在 使 用 面向 对 象 编程 范式 时 ， 我 们 使 用 对 象 隐 喻 来 指导 程序 的 组 织 。 数 据 表 示 和 操作 的 大 部 
分 逻辑 都 表达 在 类 的 定义 中 。 在 这 一 节 中 ， 我 们 会 看 到 ， 类 和 对 象 本 身 可 以 使 用 函数 和 字典 
来 表示 。 以 这 种 方式 实现 对 象 系统 的 目的 是 展示 使 用 对 象 隐 喻 并 不 需要 特殊 的 编程 语言 。 即 
使 编程 语言 没有 面向 对 象 系统 ， 程 序 照 样 可 以 面向 对 象 。 


为 了 实现 对 象 ， 我 们 需要 抛弃 点 运算 符 ( 它 需要 语言 的 内 建 支持 ) ， 并 创建 分 发 字典 ， 它 的 
行为 和 内 建 对 象 系统 的 元 素 差不多 。 我 们 已 经 看 到 如 何 通过 分 发 字典 实现 消息 传递 行为 。 为 


了 完整 实现 对 象 系统 ， 我 们 需要 在 实例 、 类 和 基 类 之 间 发 送 消 息 ， 它 们 全 部 都 是 含有 属性 的 
字典 。 


我 们 不 会 实现 整个 Python 对 象 系统 ， 它 包含 这 篇 文章 没有 涉及 到 的 特性 (比如 元 类 和 静态 方 
法 ) 。 我 们 会 专注 于 用 户 定义 的 类 ， 不 带 有 多 重 继承 和 内 省 行为 《比如 返回 实例 的 类 ) 。 我 
们 的 实现 并 不 遵循 Python 类 型 系统 的 明确 规定 。 反 之 ， 它 为 实现 对 象 隐喻 的 核心 功能 而 设 
计 。 


2.6.1 实例 


我 们 从 实例 开始 。 实 例 拥 有 具名 属性 ， 例 如 账户 余额 ， 它 可 以 被 设置 或 获取 。 我 们 使 用 分 发 
字典 来 实现 实例 ， 它 会 响应 "get”" 和 “sef" 属 性 值 消息 。 属 性 本 身 保存 在 叫做 attributes 的 局 部 
字典 中 。 


就 像 我 们 在 这 一 章 的 前 面 看 到 的 那样 ， 字 典 本 身 是 抽象 数据 类 型 。 我 们 使 用 列表 来 实现 字 
典 ， 我 们 使 用 偶 对 来 实现 列表 ， 并 且 我 们 使 用 函数 来 实现 偶 对 。 就 像 我 们 以 字典 实现 对 象 系 
统 那 样 ， 要 注意 我 们 能 够 仅仅 使 用 函数 来 实现 对 象 。 


为 了 开始 我 们 的 实现 ， 我 们 假设 我 们 拥有 一 个 类 实现 ， 它 可 以 查找 任何 不 是 实例 部 分 的 名 
称 。 我 们 将 类 作为 参数 cls 传递 给 make_instance 。 


>>> def make_jinstance(cls): 
RetunnEaanmewnobjectinsktanceAuiwhnensEacspatccnadTctionarnys ee 
def get_value(name ) : 
If name in attributes : 
return attributes[name] 
elses 
value = cls['get'](name) 
return bind_ method(value, instance) 
def set_value(name, value): 
attributes[name] = value 
attributes = {} 
instance = {'gyget': get value, 'set': set_ value} 
return instance 


instance 是 分 发 字典 ， 它 响应 消息 get 和 set 。 set 消息 对 应 Python 对 象 系统 的 属性 赋 
值 : 所 有 赋值 的 属性 都 直接 储存 在 对 象 的 局 部 属性 字典 中 。 在 有 中 ， 如 果 name 在 局 

部 attributes 字典 中 不 存在 ， 那 么 它 会 在 类 中 了 寻找。 如果 cls 返回 的 value 为 函数 ， 它 必须 
绑 定 到 实例 上 。 


绑 定 方法 值 ° make_instance 中 的 get_value 使 用 get 寻找 类 中 的 具名 属性 ， 之 后 调 
用 bind method 。 方 法 的 绑 定 只 在 函数 值 上 调用 ， 并 且 它 会 通过 将 实例 插入 为 第 一 个 参数 ， 从 
函数 值 创 建 绑 定 方法 的 值 。 


>>> def bind method(value, instance): 

"Retunneadboundmethod ri value rs callables or valuenothnerwise 
if callable(value): 

def method(*args): 

return value(instance, *args) 

return method 
else: 

return value 


当 方 法 被 调用 时 ， 第 一 个 参数 self 通过 这 个 定义 绑 定 到 了 instance 的 值 上 。 


2.6.2 


类 也 是 对 象 ， 在 Python Ne 为 了 简化 ， 我 们 假设 类 
自己 并 没有 类 (在 Python 中 ， 本 身 也 有 类 ， 几 乎 所 有 类 都 共享 相同 的 类 ， 叫 做 type ) 。 
类 可 以 接受 get 和 set pe 以 及 new 消息 。 


>>> def make class(attributes, base class=None): 
-Retunma new elass whrch isa drsnatehndnctnonarye 
def get_value(nanme): 
if name in attributes: 
return attributes[name] 
elif base_class is not None: 
return base_class['get'](name) 
def set_value(name, value): 
attributes[name] = value 
def new(*args): 
return init_instance(cls, *args) 
cls = {'get': get value, 'set': set value, 'new': new} 
return cls 


不 像 实 例 那 样 ， 类 的 get 函数 在 属性 未 找到 的 时 候 并 不 查询 它 的 类 ， 而 是 查询 它 
的 base_class 。 类 并 不 需要 方法 绑 定 。 


实例 化 ° make_class 中 的 new 有 函数 调用 了 init_instance ， 它 首先 创建 新 的 实例 ， 之 后 调用 
叫做 init 的 方法 。 


>>>°defnanntdinstance(cLls “args): 
"- Return amew obnect wnth typer cols nutralized wntn amg 
instance = make_instance(cls) 
nlite clsh get lsInItE 9 
if init: 
init(instance, *args) 
return instance 


后 这 个 函数 完成 了 我 们 的 对 象 系统 。 我 们 现在 拥有 了 实例 ， 它 的 set 是 局 部 的 ， 但 
是 get 会 回溯 到 它们 的 类 中 。 实 例 在 它 的 类 中 查找 名 称 之 后 ， 它 会 将 自己 绑 定 到 元 数值 上 来 
创建 方法 。 最 后 类 可 以 创建 新 的 ( new ) 实例 ， 并 且 在 实例 创建 之 后 立即 调用 它们 
的 _init 构造 器 。 


在 对 象 系统 中 用 户 仅 仅 可 以 调用 create_class ， WO 过 消 息 传 递 来 使 用 。 与 之 
相似 ，Python 的 对 象 系统 由 class 语句 来 调用 ， 它 的 所 有 其 他 功能 都 通过 点 表达 式 和 对 类 的 
调用 来 使 用 。 


2.6.3 使 用 所 实现 的 对 象 


我 们 现在 回 到 上 一 节 银 行 账户 的 例子 。 使 用 我 们 实现 的 对 象 系统 ， 我 们 就 可 以 创 
建 Account 类 ， checkingAccount 子 类 和 它们 的 实例 。 


Account 类 通过 create_account_class 函数 创建 ， 它 拥有 类 似 于 Python class 语句 的 结构 ， 
但 是 以 make_class 的 调用 结尾 。 


>>> def make_account_class() 
"""Return the Account class, which has deposit and withdraw methods.""" 
def mn selt account honderye 
self['set']('holder', account_holder) 
selrlsetl oalances Oh 
def depositl(selfA amount)s 
"Increase the account balance by amount and return the new balance 
new_balance = self['get']('balance') + amount 
self['set']('balance', new_balance) 
returnsedlfh get | halance) 
def withdraw(self, amount): 
Decrease the account balance by amount andireturn the new balancee 
balance = self['get']('balance') 
if amount > balance: 
returnm Tinsurfrenrent fiundsy 
self['set']('balance', balance - amount) 
returneselfl get ll( balance ) 
return make_class({' init _': ln 
'deposit': deposit, 
'withdraw': withdraw, 
“ntenest. O02 





在 这 个 函数 中 ， 属 性 名 称 在 最 后 设置 。 不 像 Python 的 class 语句 ， 它 强制 内 部 部 数 和 属性 名 
称 之 间 的 一 致 性 。 这 里 我 们 必须 手动 指定 属性 名 称 和 值 的 对 应 关系 。 


Account 类 最 终 由 赋值 来 实例 化 。 
>>> Account = make_account_class() 
之 后 ， 账 户 实例 通过 new 消息 来 创建 ， 它 需要 名 称 来 处 理 新 创建 的 账户 。 
>>> jim_acct = Account['new']('Jim') 
之 后 ，get 消息 传递 给 jim_acct ， 来 获取 属性 和 方法 。 方 法 可 以 调用 来 更 新 账户 余额 。 


>>> jim acct['get']('holder') 


Jn 

>>>>Jimiaccth get (interest) 
OO 

之 >> jmiacctl get |( deposat )(20) 
20 

>>> jim acct['get']('withdraw' )(5) 
15 


就 像 使 用 Python 对 象 系统 那样 ， 设 置 实例 的 属性 并 不 会 修改 类 的 对 应 属性 : 


>>> jim acct['set']('interest', 0.04) 
>>> Account['get']('interest') 
OO2 


继承 。 我 们 可 以 创建 checkingAccount 子 类 ， 通 过 履 盖 类 属性 的 子 集 。 在 这 里 ， 我 们 修 
改 withdraw 方法 来 收取 费用 ， 并 且 降 低 了 利率 。 


>>> def make_checking_account_class() : 
"Return the checkingAccount class whichn imposes a st withdrawal fees 
def withdraw(self, amount): 
return Account['get']('withdraw')(self, amount + 1) 
return make_class({'withdraw': withdraw, 'interest': 0.01}, Account) 


在 这 个 实现 中 ， 我 们 在 子 类 的 withdraw 中 调用 了 基 类 Account 的 withdraw 有 函数 ， 就 像 在 
Python 内 建 对 象 系统 那样 。 我 们 可 以 创建 子 类 本 身 和 它 的 实例 ， 就 像 之 前 那样 : 


>>> CheckingAccount = make_checking_account_class() 
>>> jack_acct = CheckingAccount['new']('Jack') 


它们 的 行为 相似 ， 构 造 函 数 也 一 样 。 每 笔 取 款 都 会 在 特殊 的 withdraw 函数 中 收费 $1， 并 
且 interest 也 拥有 新 的 较 低 值 。 


>>> jack_acct['get']('interest') 
0501 

>>> jack_acct['get']('deposit')(20) 
20 

>>> jack_acct['get']('withdraw' )(5) 
14 


我 们 的 构建 在 字典 上 的 对 象 系统 十 分 类 似 于 Python 内 建 对 象 系统 的 实现 。Python 中 ， 任 何 

用 户 定义 类 的 实例 ， 都 有 个 特殊 的 _dict _ 属性 ， 将 对象 的 局 部 实例 属性 储存 在 字典 中 ， 就 
像 我 们 的 attributes 字典 那样 。Python 的 区 别 在 于 ， 它 区 分 特定 的 特殊 方法 ， 这 些 方 法 和 内 
建 函 数 交 互 来 确保 那些 函数 能 正常 处 理 许多 不 同类 型 的 参数 。 操 作 不 同类 型 参数 的 函数 是 下 

一 节 的 主题 。 


2.7 泛 用 方法 
来 源 : 2.7 Generic Operations 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


这 一 章 中 我 们 引入 了 复合 数据 类 型 ， 以 及 由 构造 器 和 选择 器 实现 的 数据 抽象 机 制 。 使 用 消息 
传递 ， 我 们 就 能 使 抽象 数据 类 型 直接 拥有 行为 。 使 用 对 象 隐 哈 ， 我 们 可 以 将 数据 的 表示 和 用 
于 操作 数据 的 方法 绑 定 在 一 起 ， 从 而 使 数据 驱动 的 程序 模块 化 ， 并 带 有 局 部 状态 。 


但 是 ， 我 们 仍然 必须 展示 ， 我 们 的 对 象 系统 允许 我 们 在 大 型 程序 中 灵活 组 合 不 同类 型 的 对 
象 。 点 运算 符 的 消息 传递 仅仅 是 一 种 用 于 使 用 多 个 对 象 构 建 组 合 表达 式 的 方式 。 这 一 节 中 ， 
我 们 会 探索 一 些 用 于 组 合 和 操作 不 同类 型 对 象 的 方式 。 


2.7.1 字符 串 转换 


我 们 在 这 一 章 最 开始 说 ， 对 象 值 的 行为 应 该 类 似 它 所 表达 的 数据 ， 包 括 产 生 它 自己 的 字符 串 
表示 。 数 据 值 的 字符 囊 表 示 在 类 似 Python 的 交互 式 语言 中 万 其 重要 ， 其 中 “ 读 取 - 求 值 - 打 
印 "的 循环 需要 每 个 值 都 拥有 某 种 字符 串 表 示 形 式 。 


字符 串 值 为 人 们 的 信息 交流 提供 了 基础 的 媒介 。 字 符 序 列 可 以 在 屏幕 上 泻 染 ， 打 印 到 纸 上 ， 
大 声 朗 读 ， 转 换 为 讶 文 ， 或 者 以 英 尔 兹 码 广 播 。 字 符 串 对 编程 而 言 也 非常 基础 ， 因 为 它们 可 
以 表示 Python 表达 式 。 对 于 一 个 对 象 ， 我 们 可 能 希望 生成 一 个 字符 串 ， 当 作为 Python 表达 
式 解释 时 ， 求 值 为 等 价 的 对 象 。 


Python 规定 ， 所 有 对 象 都 应 该 能 够 产生 两 种 不 同 的 字符 串 表示 : 一 种 是 人 类 可 解释 的 文本 ， 
另 一 种 是 Python 可 解释 的 表达 式 。 字 符 串 的 构造 函数 str 返回 人 类 可 读 的 字符 串 。 在 可 能 的 
情况 下 ， repr 函数 返回 一 个 Python 表达 式 ， 它 可 以 求 值 为 等 价 的 对 象 。 repr 的 文档 字符 
串 解释 了 这 个 特性 : 


repr(object) -> string 


Return the canonical string representation of the object. 
For most object types, eval(repr(object)) == object. 


在 表达 式 的 值 上 调用 repr 的 结果 就 是 Python 在 交互 式 会 话 中 打印 的 东西 。 


>>>0 12812 
12000000000000.0 

>>> print(repr(12e12)) 
12000000000000.0 


在 不 存在 任何 可 以 求 值 为 原始 值 的 表达 式 的 情况 中 ，Python 会 产生 一 个 代理 : 


>>> repr (min) 
<bunmLte mn functronmmn 


str 构造 器 通常 与 repr 相同 ， 但 是 有 时 会 提供 更 加 可 解释 的 文本 表示 。 例 如 ， 我 们 可 以 看 
到 str 和 repr 对 于 日 期 的 不 同 : 


>>> from datetime import date 
>>> today = date(2011, 9, 12) 
>>> repr(today ) 
datetimesdate(20l 9 12) 
>>> str(today) 

"2011-09-12， 


repr 子 数 的 定义 出 现 了 新 的 挑战 : 我 们 希望 它 对 所 有 数据 类 型 都 正确 应 用 ， 甚 至 是 那些 
在 repr 实现 时 还 不 存在 的 类 型 。 我 们 希望 它 像 一 个 多 态 函 数 ， 可 以 作用 于 许多 (多 ) 不 同形 
式 ( 态 ) 的 数据 。 


消息 传递 提供 了 这 个 问题 的 解决 方案 : repr 总数 在 参数 上 调用 叫做 _repr 的 函数 。 


>>> today, repr_ () 
datetimesdate(2011T 9012) 


通过 在 用 户 定义 的 类 上 实现 同一 方法 ， 我 们 就 可 以 将 repr 的 适用 性 扩展 到 任何 我 们 以 后 创建 
的 类 。 这 个 例子 强调 了 消息 传递 的 另 一 个 普遍 的 好 处 : 就 是 它 提供 了 一 种 机 制 ， 用 于 将 现 有 
函数 的 职责 范围 扩展 到 新 的 对 象 。 


str 构造 器 以 类 似 的 方式 实现 : 它 在 参数 上 调用 了 叫做 _ str 的 方法 。 


>>> today, str_() 


'2011-99-12， 
这 些 多 态 函 数 是 一 个 更 普遍 原则 的 例子 : 特定 函数 应 该 作用 于 多 种 数据 类 型 。 这 里 举例 的 消 
息 传 递 方法 仅仅 是 多 态 函 数 实现 家 族 的 一 员 。 本 节 剩 下 的 部 分 会 探索 一 些 备 选 方案 。 


2.7.2 多 重 表 示 


使 用 对 象 或 函数 的 数据 抽象 是 用 于 管理 复杂 性 的 强大 工具 。 抽 象 数据 类 型 允许 我 们 在 数据 表 
示 和 用 于 操作 数据 的 函数 之 间 构 造 界限 。 但 是 ， 在 大 型 程序 中 ， 对 于 程序 中 的 某 种 数据 类 
型 ， 提 及 “底层 表示 ”可 能 不 总 是 有 意义 。 首 先 ， 一 个 数据 对 象 可 能 有 多 种 实用 的 表示 ， 而 且 我 
们 可 能 希望 设计 能 够 处 理 多 重 表 示 的 系统 。 


为 了 选取 一 个 简单 的 示例 ， 复 数 可 以 用 两 种 几乎 等 价 的 方式 来 表示 : 直角 坐标 〈 诬 部 和 实 
部 ) 以 及 极 坐标 〈 模 和 角度 ) 。 有 时 直角 坐标 形式 更 加 合适 ， 而 有 时 极 坐 标 形式 更 加 合适 。 
复数 以 两 种 方式 表示 ， 而 操作 复数 的 函数 可 以 处 理 每 种 表示 ， 这 样 一 个 系统 确实 比较 合理 。 


更 重要 的 是 ， 大 型 软件 系统 工程 通常 由 许多 人 设计 ， 并 花费 大 量 时 间 ， 需 求 的 主题 随时 间 而 
改变 。 在 这 样 的 环境 中 ， 每 个 人 都 事先 同意 数据 表示 的 方案 是 不 可 能 的 。 除 了 隔离 使 用 和 表 
示 的 数据 抽象 的 界限 ， 我 们 需要 隔离 不 同 设计 方案 的 界限 ， 以 及 允许 不 同方 案 在 一 个 程序 中 
共存 。 进 一 步 ， 由 于 大 型 程序 通常 通过 组 合 已 存在 的 模块 创建 ， 这 些 模块 会 单独 设计 ， 我 们 
需要 一 种 惯例 ， 让 程序 员 将 模块 递增 地 组 合 为 大 型 系统 。 也 就 是 说 ， 不 需要 重复 设计 或 实现 
这 些 模块 。 

我 们 以 最 简单 的 复数 示例 开始 。 我 们 会 看 到 ， 消 息 传递 在 维持 “复数 "对 象 的 抽象 概念 时 ， 如 何 
让 我 们 为 复数 的 表示 设计 出 分 离 的 直角 坐标 和 极 坐 标 表示 。 我 们 会 通过 使 用 泛 用 选择 器 为 复 
数 定义 算数 函数 ( add_complex ， mul complex ) 来 完成 它 。 泛 用 选择 器 可 访问 复数 的 一 部 
分 ， 独 立 于 数值 表示 的 方式 。 所 产生 的 复数 系统 包含 两 种 不 同类 型 的 抽象 界限 。 它 们 隔离 了 
高 阶 操作 和 低 阶 表示 。 此 外 ， 也 有 一 个 重 直 的 界限 ， 它 使 我 们 能 够 独立 设计 替代 的 表示 。 


Complex numbers In the problem domain 


add_complex mul_complex 





Complex numbers as two-dimensional vectors 


real imag magnitude angle | 








Rectangular Polar 
representation representation 


作为 边 注 ， 我 们 正在 开发 一 个 系统 ， 它 在 复数 上 执行 算数 运算 ， 作 为 一 个 简单 但 不 现实 的 使 
用 泛 用 操作 的 例子 。 复 数 类 型 实际 上 在 Python 中 已 经 内 建 了 ， 但 是 这 个 例子 中 我 们 仍然 自己 
实现 。 


就 像 有 理 数 那样 ， 复 数 可 以 自然 表示 为 偶 对 。 复 数 集 可 以 看 做 带 有 两 个 正 交 轴 ， 实 数 轴 和 虚 
数 轴 的 二 维 空间 。 根 据 这 个 观点 ， 复 数 z=x+y*i (其 中 i*i = -1 ) 可 以 看 做 平面 上 的 
点 ， 它 的 实数 为 x ， 虚 部 为 y 。 复 数 加 法 涉及 到 将 它们 的 实 部 和 虚 部 相 加 。 


对 复数 做 乘法 时 ， 将 复数 以 极 坐 标 表示 为 模 和 角度 更 加 自然 。 两 个 复数 的 乘积 是 ， 将 一 个 复 
数 按 照 另 一 个 的 长 度 作为 因数 拉 伸 ， 之 后 按照 另 一 个 的 角度 来 旋转 它 的 所 得 结果 。 


所 以 ， 复 数 有 两 种 不 同 表示 ， 它 们 适用 于 不 同 的 操作 。 然 而 ， 从 一 些 人 编写 使 用 复数 的 程序 
的 角度 来 看 ， 数 据 抽象 的 原则 表明 ， 所 有 操作 复数 的 运算 都 应 该 可 用 ， 无 论 计算 机 使 用 了 哪 
个 表示 。 


接口 。 消 息 传递 并 不 仅仅 提供 用 于 组 装 行 为 和 数据 的 方式 。 它 也 允许 不 同 的 数据 类 型 以 不 同 
方式 响应 相同 消息 。 来 自 不 同 对 象 ， 产 生 相 似 行为 的 共享 消息 是 抽象 的 有 力 手段 。 
像 之 前 看 到 的 那样 ， 抽 象 数据 类 型 由 构造 器 、 选 择 器 和 额外 的 行为 条 件 定 义 。 与 之 紧密 相关 


的 概念 是 接口 ， 它 是 共享 消息 的 集合 ， 带 有 它们 含义 的 规定 。 响 应 _repr 和 _str ”特殊 
方法 的 对 象 都 实现 了 通用 的 接口 ， 它 们 可 以 表示 为 字符 串 。 





在 复数 的 例子 中 ， 接 口 需要 实现 由 四 个 消息 组 成 的 算数 运 
算 : real ，imag ， magnitude 和 angle 。 我 们 可 以 使 用 这 些 消息 实现 加 法 和 乘法 。 


我 们 拥有 两 种 复数 的 抽象 数据 类 型 ， 它 们 的 构造 器 不 同 。 


e CcomplexRI 从 实 部 和 虚 部 构造 复数 。 
e CcomplexMA 从 模 和 角度 构造 复数 。 


使 用 这 些 消 息 和 构造 器 ， 我 们 可 以 实现 复数 算数 : 


>>> def add complex(z1, z2): 
return ComplexRI(z1.real + Zz2.real, zi1.imag + Zz2.imag) 
>>>" def mul complex(z1i, 2z2): 
return ComplexMA(z1.magnitude * z2.magnitude, zi.angle + z2.angle) 


术语 “抽象 数据 类 型 ” (ADT) 和 “接口 "的 关系 是 微妙 的 。ADT 包含 构建 复杂 数据 类 的 方式 ， 以 
单元 操作 它们 ， 并 且 可 以 选择 它们 的 组 件 。 在 面向 对 象 系统 中 ，ADT 对 应 一 个 类 ， 虽 然 我 们 
已 经 看 到 对 象 系统 并 不 需要 实现 ADT。 接 口 是 一 组 与 含义 关联 的 消息 ， 并 且 它 可 能 包含 选择 
器 ， 也 可 能 不 包含 。 概 念 上 ，ADT 描述 了 一 类 东西 的 完整 抽象 表示 ， 而 接口 规定 了 可 能 在 许 
多 东西 之 间 共 享 的 行为 。 


属性 (Property) 。 我 们 希望 交替 使 用 复数 的 两 种 类 型 ， 但 是 对 于 每 个 数值 来 说 ， 储 存 重复 
的 信息 比较 浪费 。 我 们 希望 储存 实 部 - 虚 部 的 表示 或 模 -角度 的 表示 之 一 。 


Python 拥有 一 个 简单 的 特性 ， 用 于 从 零 个 参数 的 函数 凭空 计算 属性 
(Attribute) 。 @property 装饰 器 允许 函数 不 使 用 标准 调用 表达 式 语法 来 调用 。 根 据 实 部 和 虚 
部 的 复数 实现 展示 了 这 一 点 。 


>>> from math Import atan2 
>>>°"class ComplexRI(oObJecE): 
def Laitsef real magds: 
self.real = real 
self.imag = imag 
@property 
def magnitude(self): 
return (self.real ** 2 + Self.imag 2) > 95 
@property 
def "angle(selt): 
return atan2(self.imag, self.real) 
def repren(sesh): 


return 'ComplexRI({0}, {1})'.format(self.real, self.imag) 


第 二 种 使 用 模 和 角度 的 实现 提供 了 相同 接口 ， 因 为 它 响应 同一 组 消息 。 


>>> from math Import sin, cos 
>>> class ComplexMA(object): 
def nit (self magnatuder angle): 
self.magnitude = magnitude 
self.angle = angle 
@property 
def real(self): 
return self.magnitude * cos(self.angle) 
@property 
def imag(self): 
return self.magnitude * sin(self.angle) 
def hepren(serh): 
return 'ComplexMA({0}, {1})'.format(self.magnitude, 


self.angle) 


实际 上 ， 我 们 的 add_complex 和 mul_complex 实现 并 没有 完成 ; 每 个 复数 类 可 以 用 于 任何 算数 


函数 的 任何 参数 。 对 象 系统 不 以 任何 方式 显 式 连接 (例如 通过 继承 ) 


这 两 种 复数 类 型 ， 这 需 


要 给 个 注解 。 我 们 已 经 通过 在 两 个 类 之 间 共 享 一 组 通用 的 消息 和 接口 ， 实 现 了 复数 抽象 。 


>>> from math import pi 

>>> add_complex(ComplexRI(1, 2), ComplexMA(2, pi/2)) 
ComplexRI(1.0000000000000002,，4.0) 

>>> mul_complex(ComplexRI(0, 1), ComplexRI(0, 1)) 
ComplexMA(1.0, 3.141592653589793) 


编码 多 种 表示 的 接口 拥有 良好 的 特性 。 用 于 每 个 表示 的 类 可 以 独立 开发 ; 它们 只 需要 遵循 它 
们 所 共享 的 属性 名 称 。 这 个 接口 同时 是 递增 的 。 如 果 另 一 个 程序 员 和 希望 向 相同 程序 添加 第 三 


个 复数 表示 ， 它 们 只 需要 使 用 相同 属性 创建 另 一 个 类 。 


特殊 方法 。 内 建 的 算数 运算 符 可 以 以 一 种 和 repr 相同 的 方式 扩展 ; 它们 是 特殊 的 方法 名 称 ， 


对 应 Python 的 算数 、 人 逻辑 和 序列 运算 的 运算 符 。 


为 了 使 我 们 的 代码 更 加 易 读 ， 我 们 可 能 硕 望 在 执行 复数 加 法 和 乘法 时 直接 使 用 + 和 * 运算 
这 此 


符 。 将 下 列 方法 添加 到 两 个 复数 类 中 ， 
的 add 和 mul 况 数 可 用 。 


会 让 这 些 运算 符 ， 以 及 opertor 模块 中 


>>> ComplexRI. add _ 
>>> ComplexMA. add _ 
>>> ComplexRI. mul 
>>> ComplexMA. mul _ 


lambda self, other: add_complex(self, other) 
lambda self, other: add_complex(self, other) 
lambda self, other: mul_ complex(self, other) 
lambda self, other: mul_ complex(self, other) 


现在 ， 我 们 可 以 对 我 们 的 自 定义 类 使 用 中 级 符号 。 


>>> ComplexRI(1, 2) + ComplexMA(2, 0) 
ComplexRI(3.0, 2.0) 

>>> ComplexRI(0, 1) * ComplexRI(0, 1) 
ComplexMA(1.0, 3.141592653589793) 


扩展 阅读 。 为 了 求解 含有 + 运算 符 的 表达 式 ，Python 会 检查 表达 式 的 左 操 作 数 和 右 操作 数 上 
的 特殊 方法 。 首 先 ，Python 会 检查 左 操作 数 的 add 方法， 之 后 检查 右 操作 数 
的 _radd 方法。 如果 二 者 之 一 被 发 现 ， 这 个 方法 会 以 另 一 个 操作 数 的 值 作为 参数 调用 。 


在 Python 中 求解 含有 任何 类 型 的 运算 符 的 表达 值 具有 相似 的 协议 ， 这 包括 切片 符号 和 布尔 运 
算 符 。Python 文档 列 出 了 完整 的 运算 符 的 方法 名 称 。Dive into Python 3 的 特殊 方法 名 称 一 章 
兽 述 了 许多 用 于 Python 解释 器 的 细节 。 


2.7.3 泛 用 函数 


我 们 的 复数 实现 创建 了 两 种 数据 类 型 ， 它 们 对 于 add_complex 和 mul_complex 函数 能 够 互相 转 
换 。 现 在 我 们 要 看 看 如 何 使 用 相同 的 概念 ， 不 仅仅 定义 不 同 表 示 上 的 泛 用 操作 ， 也 能 用 来 定 
义 不 同 种 类 、 并 且 不 共享 通用 结构 的 参数 上 的 泛 用 操作 。 


我 们 到 目前 为 止 已 定义 的 操作 将 不 同 的 数据 类 型 独立 对 待 。 所 以 ， 存 在 用 于 加 法 的 独立 的 
包 ， 比 如 两 个 有 理 数 或 者 两 个 复数 。 我 们 没有 考虑 到 的 是 ， 定 义 类 型 界限 之 间 的 操作 很 有 意 
义 ， 比 如 将 复数 与 有 理 数 相 加 。 我 们 经 历 了 巨大 的 痛苦 ， 引 入 了 程序 中 各 个 部 分 的 界限 ， 便 
于 让 它们 可 被 独立 开发 和 理解 。 


我 们 希望 以 某 种 精确 控制 的 方式 引入 跨 类 型 的 操作 。 便 于 在 不 严重 违反 抽象 界限 的 情况 下 支 
持 它 们 。 在 我 们 希望 的 结果 之 间 可 能 有 些 矛盾 : 我 们 希望 能 够 将 有 理 数 与 复数 相 加 ， 也 项 望 
能 够 使 用 泛 用 的 add 函数 ， 正 确 处 理 所 有 数值 类 型 。 同 时 ， 我 们 布 望 隔离 复数 和 有 理 数 的 细 
节 ， 来 维持 程序 的 模块 化 。 


让 我 们 使 用 Python 内 建 的 对 象 系统 重新 编写 有 理 数 的 实现 。 像 之 前 一 样 ， 我 们 在 较 低 层级 将 
有 理 数 储存 为 分 子 和 分 母 。 


>>> from fractions import gcd 
>>> class Rational(object): 
def init (self numer, denom): 
g = gcd(numer, denom) 
self.numer = numer // g 
self.denom = denom // gd 
def repre(sedh): 
return 'Rational({0}, {1})'.format(self.numer, self.denom) 


这 个 新 的 实现 中 的 有 理 数 的 加 法 和 乘法 和 之 前 类 似 。 


>>>°"def add®rational(x, ay) 
nx, dx = x.numer, x.denom 
ny, dy = y.numer, y.denom 
return Rational(nx * dy + ny * dx, dx * dy) 
>>>°defr mul rational(x yy): 
return Rational(x.numer * y.numer, x.denom * y.denom) 


类 型 分 发 。 一 种 处 理 跨 类 型 操作 的 方式 是 为 每 种 可 能 的 类 型 组 合 设计 不 同 的 函数 ， 操 作 可 用 
于 这 种 类 型 。 例 如 ， 我 们 可 以 扩展 我 们 的 复数 实现 ， 使 其 提供 函数 用 于 将 复数 与 有 理 数 相 
加 。 我 们 可 以 使 用 叫做 类 型 分 发 的 机 制 更 通用 地 提供 这 个 功能 。 


堪 


类 型 分 发 的 概念 是 ， 编 写 一 个 函数 ， 首 先 检 测 接 受到 的 参数 类 型 ， 之 后 执行 适用 于 这 种 类 
的 代码 。Python 中 ， 对 象 类 型 可 以 使 用 内 建 的 type 函数 来 检测 。 


>>> def iscomplex(z): 

return type(z) in (ComplexRI, ComplexMA) 
>>> def isrational(z): 

return type(z) == Rational 


这 里 ， 我 们 依赖 一 个 事实 ， 每 个 对 象 都 知道 自己 的 类 型 ， 并 且 我 们 可 以 使 用 Python 
的 type 函数 来 获取 类 型 。 即 使 type 函数 不 可 用 ， 我 们 也 能 根 


据 Rational ， ComplexRI 和 ComplexMA 来 实现 iscomplex 和 isrational 。 


现在 考虑 下 面 的 add 实现 ， 它 显 式 检查 了 两 个 参数 的 类 型 。 我 们 不 会 在 这 个 例子 中 显 式 使 用 
Python 的 特殊 方法 (例如 _add ) 。 


>>> def add_complex_and_rational(z, r): 
return ComplexRI(z.real + r.numer/r.denom, z.imag) 
>>>°def add(z1. z2): 
”Add zi and z2 which may be complex or ratyonal.",” 
If iscomplex(z1) and iscomplex(z2): 
return add_complex(z1, 2z2) 
elif iscomplex(z1) and isrational(z2): 
return add_complex_and_rational(z1, 2z2) 
elif isrational(z1) and iscomplex(z2): 
return add_complex_and_rational(z2, 2z1) 
elLses: 
return add_rational(z1, 2z2) 


这 个 简单 的 类 型 分 发 方式 并 不 是 递增 的 ， 它 使 用 了 大 量 的 条 件 语句 。 如 果 另 一 个 数值 类 型 包 
含 在 程序 中 ， 我 们 需要 使 用 新 的 语句 重新 实现 add 。 
我 们 可 以 创建 更 灵活 的 add 实现 ， 通 过 以 字典 实现 类 型 分 发 。 要 想 扩展 add 的 灵活 性 ， 第 一 
步 是 为 我 们 的 类 创建 一 个 tag 集合 ， 抽 离 两 个 复数 集合 的 实现 。 

>>> def type_tag(x): 


return type_tag.tags[type(x)] 
>>> type_tag.tags = {ComplexRI: 'com', ComplexMA: 'com', Rational: 'rat'} 


下 面 ， 我 们 使 用 这 些 


用 这 些 类 型 标签 来 索引 字典 ， 字 典 中 储存 了 数值 加 法 的 不 同方 式 。 字 典 的 键 是 
类 型 标签 的 元 素 ， 值 是 类 型 


类 型 特定 的 加 法 函数 。 


>>> def add(z1, z2): 


types = (type_tag(z1), type_tag(z2)) 
return add.implementations[types](z1, z2) 


这 个 基于 字典 的 分 发 方式 是 递增 的 ， 因 为 pe | SR tag.tags 总 是 可 以 扩 
展 。 任 何 新 的 数值 类 型 可 以 将 自己 “安装 ?到 现存 的 系统 中 ， 这 些 字 典 添加 新 的 条 目 。 


人 系统 引入 一 些 复 杂 性 时 ， 我 们 现在 拥有 了 泛 用 、 可 扩展 的 add 区 数 ， 可 以 处 理 混合 


>>> add(ComplexRI(1.5, 0), Rational(3, 2)) 
ComplexRI(3.0, 0) 

>>> add(Rational(5, 3), Rational(1, 2)) 
Rational(13, 6) 


数据 导向 编程 。 我 们 基于 字典 的 add 实现 并 不 是 特定 于 加 法 的 ; 它 不 包含 任何 加 法 的 直接 逻 
辑 。 它 只 实现 了 加 法 操作 ， 因 为 我 们 碰巧 将 implementations 字典 和 函数 放 到 一 起 来 执行 加 
法 。 


更 通用 的 泛 用 算数 操作 版 本 会 将 任意 运算 符 作 用 于 任意 类 型 ， 并 且 使 用 字典 来 储存 多 种 组 合 
的 实现 。 这 个 完全 泛 用 的 实现 方法 的 方式 叫做 数据 导向 编程 。 在 我 们 这 里 ， 我 们 可 以 实现 泛 
用 加 法 和 乘法 ， 而 不 带 任何 重复 的 逻辑 。 


>>> def apply(operator_name, x, y): 
tags = (type_tag(x), type_tag(y)) 
key = (operator_name, tags) 
return apply.implementations[key](x, y) 


在 泛 用 的 apply 函数 中 ， 键 由 操作 数 的 名 称 〈 例 如 add ) ， 和 参数 类 型 标签 的 元 组 构造 。 我 
们 下 面 汽 加 了 对 复数 和 有 理 数 的 乘法 支持 。 
>>> def mul complex_and_rational(z, r): 


return ComplexMA(z.magnitude * r.numer / r.denom, z.angle) 
>>> mul_rational and_complex = lambda r, z: mul complex_and_rational(z, r) 


>>> apply.implementations = {('mul', ('com', 'com')): mul_complex, 
('mul', ('com', 'rat')): mul_ complex_and_rational, 
('mul', ('rat', 'com')): mul_rational and_complex, 
Cm Crat rac mulrational 


我 们 也 可 以 使 用 字典 的 update 方法 ， 从 add 中 将 加 法 实现 添加 到 apply 。 


>>> adders = add.implementations.items() 
>>> apply.implementations.update({('add', tags):fn for (tags, fn) In adders}) 


既然 已 经 在 单一 的 表 中 支持 了 8 种 不 同 的 实现 ， 我 们 可 以 用 它 来 更 通用 地 操作 有 理 数 和 复 
数 。 


>>> apply('add', ComplexRI(1.5, 0), Rational(3, 2)) 
ComplexRI(3.0, 0) 
>>> apply( 'mul', Rational(1, 2), ComplexMA(10, 1)) 
ComplexMA(5.0, 1) 


A 十 分 麻烦 。 使 用 这 个 一 个 系统 ， 引 
入 新 类 型 的 开销 不 仅仅 是 为 类 型 编写 
负担 比 起 定义 类 型 本 身 的 操作 需要 更 


运算 符 的 复杂 性 ， 但 是 

写 方法 ， 还 有 实现 跨 类 型 操作 的 函数 的 构造 和 安装 。 这 个 
多 代码 。 

当 类 型 分 发 机 制 和 数据 导向 编程 的 确 能 创造 泛 用 函数 的 递增 实现 时 ， 它 们 就 不 能 有 效 陋 离 实 
现 的 细节 。 独 立 数 值 类 型 的 实现 者 需要 在 编程 路 类 型 操作 时 考虑 其 他 类 型 。 组 合 有 理 歼 和 复 
数 严格 上 并 不 是 每 种 类 型 的 范围 。 在 类 型 中 制定 一 致 的 责任 分 工 政 策 ， 在 带 有 多 种 类 型 和 跨 
类 型 操作 的 系统 设计 中 是 大 势 所 趋 。 


强制 转换 。 在 完全 不 相关 的 类 型 执行 完全 不 相关 的 操作 的 一 般 情况 中 ， 实 现 显 式 的 跨 类 型 操 
作 ， 尽 管 可 能 非常 麻烦 ， 是 人 们 所 希望 的 最 佳 方 案 。 幸 运 的 是 ， 我 们 有 时 可 以 通过 利用 类 型 
系统 中 隐藏 的 额外 结构 来 做 得 更 好 。 不 同 的 数据 类 通常 并 不 是 完全 独立 的 ， 可 能 有 一 些 方 
式 ， 一 个 类 型 的 对 象 通过 它 会 被 看 做 另 一 种 类 型 的 对 象 。 这 个 过 程 叫 做 强制 转换 。 例 如 ， 如 
果 我 们 被 要 求 将 一 个 有 理 数 和 一 个 复数 通过 算数 来 组 合 ， 我 们 可 以 将 有 理 数 看 做 虚 部 为 零 的 
复数 。 通 过 这 样 做 ， 我 们 将 问题 转换 为 两 个 复数 组 合 的 问题 ， 这 可 以 通 

过 add_complex 和 mul_complex 由 经 典 的 方法 处 理 。 


通常 ， 我 们 可 以 通过 设计 强制 转换 函数 来 实现 这 个 想法 。 强 制 转换 函数 将 一 个 类 型 的 对 象 转 
换 为 另 一 个 类 型 的 等 价 对 象 。 这 里 是 一 个 典型 的 强制 转换 函数 ， 它 将 有 理 数 转换 为 虚 部 为 零 
的 复数 。 


>>> def rational to_complex(x): 
return ComplexRI(x.numer/x.denom, 0) 


现在 ， 我 们 可 以 定义 强制 转换 函数 的 字典 。 这 个 字典 可 以 在 更 多 的 数值 类 型 引入 时 扩展 。 


>>> coercions = {('rat', 'com'): rational to_complex} 


任意 类 型 的 数据 对 象 不 可 能 转换 为 每 个 其 它 类 型 的 对 象 。 例 如 ， 没 有 办 法 将 任意 的 复数 强制 
转换 为 有 理 数 ， 所 以 在 coercions 字典 中 应 该 没有 这 种 转换 的 实现 。 

使 用 coercions 字典 ， 我 们 可 以 编写 叫做 coerce_apply 的 函数 ， 它 试图 将 参数 强制 转换 为 相 
同类 型 的 值 ， 之 后 仅仅 调用 运算 符 。 coerce apply 的 实现 字典 不 包含 任何 跨 类 型 运算 符 的 实 
现 ，o 


>>>°def coerceapply(operator Name xy 入 
tx, ty = type_tag(x), type_tag(y) 
if tx != ty: 
if (tx, ty) in coercions: 
tx, x = ty, coercions[(tx, ty)](x) 
elif (ty, tx) in coercions: 
ty, y = tx, coercions[(ty, tx)](y) 
elses 
returne No coenrcnon possibLles 
key = (operator_name, tx) 
return coerce_apply.implementations[key](x, y) 


coerce_apply 的 implementations 仅仅 需要 一 个 类 型 标签 ， 因 为 它们 假设 两 个 值 都 共享 相同 的 
类 型 标签 。 所 以 ， 我 们 仅仅 需要 四 个 实现 来 支持 复数 和 有 理 数 上 的 泛 用 算数 。 


>>> coerce apply.implementations = {('mul', 'com'): mul_complex, 
('mul', 'rat'): mul_rational, 
('add', 'com'): add complex, 
('add', 'rat'): add rational} 


就 地 使 用 这 些 实现 ， coerce_apply 可 以 代替 apply ° 


>>> coerce apply('add', ComplexRI(1.5, 0), Rational(3, 2)) 
ComplexRI(3.0, 0) 

>>> coerce apply( 'mul', Rational(1, 2), ComplexMA(10, 1)) 
ComplexMA(5.0, 1.0) 


这 个 强制 转换 的 模式 比 起 显 式 定 义 跨 类 型 运算 符 的 方式 具有 优势 。 虽 然 我 们 仍然 需要 编程 强 
制 转换 函数 来 关联 类 型 ， 我 们 仅仅 需要 为 每 对 类 型 编写 一 个 函数 ， 而 不 是 为 每 个 类 型 组 合 和 
每 个 泛 用 方法 编写 不 同 的 函数 。 我 们 所 期 望 的 是 ， 类 型 间 的 合理 转换 仅仅 依赖 于 类 型 本 身 ， 
而 不 是 要 调用 的 特定 操作 。 


强制 转换 的 扩展 会 带 来 进一步 的 优势 。 一 些 更 复杂 的 强制 转换 模式 并 不 仅仅 试图 将 一 个 类 型 
强制 转换 为 另 一 个 ， 而 是 将 两 个 不 同类 型 强制 转换 为 第 三 个 。 想 一 想 蓉 形 和 长 方形 : 每 个 都 
不 是 另 一 个 的 特例 ， 但 是 两 个 都 可 以 看 做 平行 四 边 形 。 另 一 个 强制 转换 的 扩展 是 迭代 的 强制 
转换 ， 其 中 一 个 数据 类 型 通过 媒介 类 型 被 强制 转换 为 另 一 种 。 一 个 整数 可 以 转换 为 一 个 实 
数 ， 通 过 首先 转换 为 有 理 数 ， 接 着 将 有 理 数 转 换 为 实数 。 这 种 方式 的 链 式 强制 转换 降低 了 程 
序 所 需 的 转换 函数 总 数 。 


虽然 它 具 有 优势 ， 强 制 转换 也 有 潜在 的 缺陷 。 例 如 ， 强 制 转 换 函 数 在 调用 时 会 丢失 信息 。 在 
我 们 的 例子 中 ， 有 理 数 是 精确 表示 ， 但 是 当 它 们 转换 为 复数 时 会 变 得 近似 。 


一 些 编程 语言 拥有 内 建 的 强制 转换 函数 。 实 际 上 ，Python 的 早期 版 本 拥有 对 象 上 

的 coerce ”特殊 方法 。 最 后 ， 内 建 强制 转换 系统 的 复杂 性 并 不 能 支持 它 的 使 用 ， 所 以 被 移 
除了 。 反 之 ， 特 定 的 操作 按 需 强制 转换 它们 的 参数 。 运 算 符 被 实现 为 用 户 定义 类 上 的 特殊 方 
法 ， 比 如 _add 和 _ mul 。 这 完全 取决 于 你 ， 取 决 于 用 户 来 决定 是 否 使 用 类 型 分 发 ， 数 
据 导 向 编程 ， 消 息 传递 ， 或 者 强制 转换 来 在 你 的 程序 中 实现 泛 用 函数 。 





2.7 泛 用 方法 
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第 三 章 计算 机 程序 的 构造 和 解释 


3.1 引言 


来 源 : 3.1 Introduction 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


第 一 章 和 第 二 章 描述 了 编程 的 两 个 基本 元 素 : 数据 和 函数 之 问 的 紧密 联系 。 我 们 看 到 了 高 阶 
函数 如 何 将 函数 当做 数据 操作 。 我 们 也 看 到 了 数据 可 以 使 用 消息 传递 和 对 象 系统 绑 定 行为 。 
我 们 已 经 学 到 了 组 织 大 型 程序 的 技巧 ， 例 如 部 数 抽象 ， 数 据 抽象 ， 类 的 继承 ， 以 及 泛 用 遂 
数 。 这 些 核 心 概念 构成 了 坚实 的 基础 ， 来 构建 模块 化 ， 可 维护 和 可 扩展 的 程序 。 


这 一 章 专 注 于 编程 的 第 三 个 基本 元 素 : 程序 自身 。Python 程序 只 是 文本 的 集合 。 只 有 通过 解 
释 过 程 ， 我 们 才 可 以 基于 文本 执行 任何 有 意义 的 计算 。 类 似 Python 的 编程 语言 很 实用 ， 因 为 
我 们 可 以 定义 解释 器 ， 它 是 一 个 执行 Python 求 值 和 执行 过 程 的 程序 。 把 它 看 做 编程 中 最 基本 
的 概念 并 不 夸张 。 解 释 器 只 是 另 一 个 程序 ， 它 确定 编程 语言 中 表达 式 的 意义 。 


接受 这 一 概念 ， 需 要 改变 我 们 自己 作为 程序 员 的 印象 。 我 们 需要 将 自己 看 做 语言 的 设计 者 ， 
而 不 只 是 由 他 人 设计 的 语言 用 户 。 


3.1.1 编程 语言 


实际 上 ， 我 们 可 以 将 许多 程序 看 做 一 些 语言 的 解释 器 。 例 如 ， 上 一 章 的 约束 传播 器 拥有 自己 
的 原 语 和 组 合 方式 。 约 束 语言 是 十 分 专用 的 : 它 提 供 了 一 种 声明 式 的 方式 来 描述 数学 关系 的 
特定 种 类 ， 而 不 是 一 种 用 于 描述 计算 的 完全 通用 的 语言 。 虽 然 我 们 已 经 设计 了 某 种 语言 ， 这 
章 的 材料 会 极 大 扩展 我 们 可 解释 的 语言 范围 。 


编程 语言 在 语法 结构 、 特 性 和 应 用 领域 上 差别 很 大 。 在 通用 编程 语言 中 ， 函 数 定 义 和 函 数 调 
用 的 结构 无 处 不 在 。 另 一 方法 ， 存 在 不 包含 对 象 系统 、 高 阶 函 数 或 类 似 while 和 for 语句 的 
控制 结构 的 强大 的 编程 语言 。 为 了 展示 语言 可 以 有 多 么 不 同 ， 我 们 会 引入 Logo 作 为 强大 并 且 
具有 表现 力 的 编程 语言 的 例子 ， 它 包含 非常 少 的 高 级 特性 。 


这 一 童 中 ， 我 们 会 学 习 解 释 器 的 设计 ， 以 及 在 执行 程序 时 ， 它 们 所 创建 的 计算 过 程 。 为 通用 
语言 设计 解释 器 的 想法 可 能 令 人 展 惧 。 兴 竞 ， 解 释 器 是 执行 任何 可 能 计算 的 程序 ， 取 决 于 它 
们 的 输入 。 但 是 ， 典 型 的 解释 器 拥有 简洁 的 通用 结构 : 两 个 可 变 的 递归 函数 ， 第 一 个 求解 环 
境 中 的 表达 式 ， 第 二 个 在 参数 上 调用 函数 。 


式 可 能 涉及 到 调用 一 个 或 多 个 函数 。 这 一 章 接 下 来 的 两 节 专注 于 递归 函数 和 数据 结构 ， 它 们 
是 理解 解释 器 设计 的 基础 。 这 一 章 的 结尾 专注 于 两 个 新 的 编程 语言 ， 以 及 为 其 实现 解释 器 的 


3.1 引言 
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3.2 函数 和 所 生成 的 过 程 


来 源 : 3.2 Functions and the Processes They Generate 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


函数 是 计算 过 程 的 局 部 演化 模式 。 它 规定 了 过 程 的 每 个 阶段 如 何 构建 在 之 前 的 阶段 之 上 。 我 
们 希望 能 够 创建 有 关 过 程 整体 行为 的 语句 ， 而 过 程 的 局 部 演化 由 一 个 或 多 个 函数 指定 。 这 种 
分 析 通 常 非常 困难 ， 但 是 我 们 至 少 可 以 试图 描述 一 些 典 型 的 过 程 演 化 模式 。 


在 这 一 章 中 ， 我 们 会 检测 一 些 用 于 简单 函数 所 生成 过 程 的 通用 “模型 "。 我 们 也 会 研究 这 些 过 程 
消耗 重要 的 计算 资源 ， 例 如 时 间 和 空间 的 比例 。 


3.2.1 递归 函数 


如 果 函 数 的 函数 体 直接 或 者 问 接 自己 调用 自己 ， 那 么 这 个 函 数 是 递归 的 。 也 就 是 说 ， 递 归 函 
数 的 执行 过 程 可 能 需要 再 次 调用 这 个 函数 。Python 中 的 递归 函数 不 需要 任何 特殊 的 语法 ， 但 
是 它们 的 确 需要 一 些 注意 来 正确 定义 。 


作为 递归 函数 的 介绍 ， 我 们 以 将 英文 单词 转换 为 它 的 Pig Latin 等 价 形式 开始 。Pig Latin 是 一 
种 隐语 : 对 英文 单词 使 用 一 种 简单 、 确 定 的 转换 来 掩盖 单词 的 含义 。Thomas Jefferson 据 推 
测 是 先行 者 。 美 文 单词 的 Pig Latin 等 价 形式 将 辅音 前 级 〈 可 能 为 宣 ) 从 开头 移动 到 末尾 ， 并 
且 添 加 -ay 元 音 。 所 以 ， pun 会 变 成 unpay ， Stout 会 变 成 outstay ? all 会 变 


成 allay ° 


>>> def pig_latin(w): 
"Return thenprig Latinequrvalent ro EngLish word we 
If starts with a vowel(w): 
return w+ “ay 
return pig_latin(w[1:] + w[0]) 
>>> def starts with a vowel(w): 
"""Return whether w begins with a vowel.""" 
return w[0].lower() in "aeiou' 


这 个 定义 背后 的 想法 是 ， 一 个 以 辅音 开头 的 字符 串 的 Pig Latin 变 体 和 另 一 个 字符 串 的 Pig 
Latin 变 体 相 同 : 它 通过 将 第 一 个 字母 移 到 末尾 来 创建 。 于 是 ， sending 的 Pig Latin 变 体 就 
和 endings 的 变 体 ( endingsay ) 相同 。 smother 的 Pig Latin 变 体 和 mothers 的 变 体 

( othersmay ) 相同 。 而 有 全 ， 将 辅音 从 开头 移动 到 末尾 会 产生 带 有 更 少 辅音 前 组 的 更 简单 的 
问题 。 在 sending 的 例子 中 ， 将 s 移动 到 末尾 会 产生 以 元 音 开 头 的 单词 ， 我 们 的 任务 就 完成 
se 


即使 pig_latin 子 数 在 它 的 函数 体 中 调用 ， pig_latin 的 定义 是 完整 且 正 确 的 。 


>>> pig_latin('pun') 
"unpay， 


能 够 基于 函数 自身 来 定义 函数 的 想法 可 能 十 分 令 人 混乱 : “循环 "定义 如 何 有 意义 ， 这 看 起 来 不 
是 很 清楚 ， 更 不 用 说 让 计算 机 来 执行 定义 好 的 过 程 。 但 是 ， 我 们 能 够 准确 理解 递归 函数 如 何 
使 用 我 们 的 计算 环境 模型 来 成 功 调用 。 环 境 的 图 示 和 描述 pig_latin('pun') 求 值 的 表达 式 树 
展示 在 下 面 : 






pig_latin(w): | 

if starts with_a_vowel(w): 
return w+ 'ay' 

return pig_latin(w[1:] + w[0]) 






pig_latin: 


starts with a_vowel: 









a 。 starts_with a_vowel(w): | 
w: UNp w: pun : | return w[8] .lower() in :aeiou' 
A A a: 
a . : pA 
。 ”Ble Latin( WOn 
if starts with a vowel (w): 
me AR @ return Ww 'ay 
: return pig latin(w[1:] + w[0]) 
。 > 


pig latin(w[1:] + w[0]) 


if starts with a vowel(w): 


return w+ ay 
return pig latin(w[1:] + W[0]) 


Python 求 值 过 程 的 步骤 产生 如 下 结果 : 


1. pig_latin 的 def 语句 被 执行 ， 其 中 : 
i， 使 用 函数 体 创 建新 的 pig_latin 函数 对 象 ， 并 且 
ii， 将 名 称 pig_latin 在 当前 (全 局 ) 帧 中 绑 定 到 这 个 函数 上 。 
2. starts_with_a_vowel 的 def 语句 类 似 地 执行 。 
3. 求 出 pig latin('pun') 的 调用 表达 式 ， 通 过 
i， 求 出 运算 符 和 操作 数 子 表达 式 ， 通 过 
i， 查 找 绑 定 到 pig_latin 函数 的 pig_latin 名 称 
ii， 对 字符 串 对 象 'pun' 求 出 操作 数字 符 串 字面 值 
ii， 在 参数 'pun' 上 调用 pig_latin 函数 ， 通 过 
ij， 添加 扩展 自 全 局 帧 的 局 部 帧 
ii， 将 形 参 w 绑 定 到 当前 帧 的 实 参 'pun' 上 。 
ii， 在 以 当前 帧 起 始 的 环境 中 执行 pig_latin 的 函数 体 


i 最 开始 的 条 件 语 名 没有 效果 ， 因 为 头 部 表达 式 求 值 为 False 
ii， 求 出 最 后 的 返回 表达 式 pig latin(w[1:] + w[06]) ， 通 过 
i， 查 找 绑 定 到 pig_latin 函数 的 pig_latin 名 称 
ii， 对 字符 串 对 象 'pun' 求 出 操作 数 表达 式 
ii， 在 参数 'unp' 上 调用 pig_latin ， 它 会 从 pig_latin 函数 体 中 的 条 件 
语句 组 返回 预期 结果 。 


就 像 这 个 例子 所 展示 的 那样 ， 虽 然 北 归 函 数 具 有 循环 特征 ， 他 仍旧 正确 调用 。 pig latin 萄 
数 调 用 了 两 次 ， 但 是 每 次 都 带 有 不 同 的 参数 。 虽 然 第 二 个 调用 来 自 pig latin 自己 的 函数 
体 ， 但 由 名 称 查找 函数 会 成 功 ， 因 为 名 称 pig_latin 在 它 的 函数 体 执行 前 的 环境 中 绑 定 。 


这 个 例子 也 展示 了 Python 的 递归 函数 的 求 值 过 程 如 何 与 递归 函数 交互 ， 来 产生 带 有 许多 获 套 
步骤 的 复杂 计算 过 程 ， 即 使 函数 定义 本 身 可 能 包含 非常 少 的 代码 行 数 。 


3.2.2 剖析 递归 函数 


许多 递归 有 函数 的 函数 体 中 都 存在 通用 模式 。 函 数 体 以 基本 条 件 开始 ， 它 是 一 个 条 件 语句 ， 为 
需要 处 理 的 最 简单 的 输入 定义 函数 行为 。 在 pig_latin 的 例子 中 ， 基 本 条 件 对 任何 以 元 音 开 
头 的 单词 成 立 。 这 个 时 候 ， 只 需要 返回 末尾 附加 ay 的 参数 。 一 些 递归 函数 会 有 多 重 基 本 条 
件 。 


基本 条 件 之 后 是 一 个 或 多 个 递归 调用 。 递 归 调 用 有 特定 的 特征 : 它们 必须 简化 原始 问题 。 

在 pig_latin 的 例子 中 ，w 中 最 开始 辅音 越 多 ， 就 需要 越 多 的 处 理工 作 。 在 递归 调 

用 pig_latin(w[1:] + w[9]) 中 ， 我 们 在 一 个 具有 更 少 初始 辅音 的 单词 上 调用 pig_latin -- 这 
就 是 更 简化 的 问题 。 每 个 成 功 的 pig_latin 调用 都 会 更 加 简化 ， 直 到 满足 了 基本 条 件 : 一 个 
没有 初始 辅音 的 单词 。 


递归 调用 通过 逐步 简化 问题 来 表达 计算 。 与 我 们 在 过 去 使 用 过 的 迭代 方式 相 比 ， 它 们 通常 以 
不 同方 式 来 解决 问题 。 考 虑 用 于 计算 n 的 阶乘 的 函数 fact ， 其 中 fact(4) 计算 


7 2 列 。 


使 用 while 语句 的 自然 实现 会 通过 将 每 个 截至 n 的 正 数 相 乘 来 求 出 结果 。 


>>> def fact iter(n): 
昌 起 ale k= 
while k <= n: 
total, k = total * k, k +1 
return total 
>>> fact_iter(4) 
24 


另 一 方面 ， 阶 乘 的 递归 实现 可 以 以 fact(n-1) (一 个 更 简单 的 问题 ) 来 表示 fact(n) 。 递 归 
的 基本 条 件 是 问题 的 最 简 形 式 : fact(1) 是 1。 


>>>>defnfact(n): 
if n == 1: 
eum 
return n * fact(n-1) 
>>> fact(4) 
24 


浮 数 的 正确 性 可 以 轻易 通过 阶乘 函数 的 标准 数学 定义 来 验证 。 


(ne =n (mn 2 
mn (nn 2 
n! = n:(n - 1)! 


这 两 个 阶乘 函数 在 概念 上 不 同 。 迄 代 的 函数 通过 将 每 个 式 子 ， 从 基本 条 件 1 到 最 终 的 总 数 逐 
步 相 乘 来 构造 结果 。 另 一 方面 ， 递 内 函 数 直 接 从 最 终 的 式 子 n 和 简化 的 问题 fact(n-1) 构造 
结果 。 


将 fact 函数 应 用 于 更 简单 的 问题 实 侦 » 来 展开 递归 的 同时 结果 最 终 由 基本 条 件 构建 。 下 面 
的 图 示 展 示 了 递归 如 何 向 fact 传 入 1 而 终止 ， 以 及 每 个 调用 的 结果 如 何 依赖 于 下 一 个 调 
用 ， 直 到 满足 了 基本 条 件 。 














return 1 
return n * fact(n-1) 


fact(n-1) 


if n == 1: 
return 1 
return n * fact(n-1) 












{ fact(n-1) 





if n == 1: 
return 1 
return n * fact(n-1) 


fact(n-1) 





J if n == 1: 
“| return 1 
return n * fact(n-1) 





虽然 我 们 可 以 使 用 我 们 的 计算 模型 展开 递归 ， 通 常 把 递归 调用 看 做 函数 抽象 更 清晰 一 些 。 也 
就 是 说 ， 我 们 不 应 该 关心 fact(n-1) 如 何在 fact 的 函数 体 中 实现 ; 我 们 只 需要 相信 它 计算 
了 n-1 的 阶乘 。 将 递归 调用 看 做 函数 抽象 叫做 递归 的 "信仰 飞跃 ” (leap of faith ) 。 我 们 以 函 
数 自身 来 定义 函数 ， 但 是 仅仅 相信 更 简单 的 情况 在 验证 函数 正确 性 时 会 正常 工作 。 这 个 例子 
中 我 们 相信 ， fact(n-1) 会 正确 计算 (n-1)! ; 我 们 只 需要 检查 ， 如 果 满 足 假设 n! 是 否 正确 
计算 。 这 样 ， 递 归 函 数 正确 性 的 验证 就 变 成 了 一 种 归纳 证 明 。 


函数 fact_iter 和 fact 也 不 一 样 ， 因 为 前 者 必须 引入 两 个 额外 的 名 称 ，total 和 k ， 它 们 
在 递归 实现 中 并 不 需要 。 通 常 ， 和 迭代 函数 必须 维护 一 些 局 部 状态 ， 它 们 会 在 计算 过 程 中 改 
变 。 在 任何 迭代 的 时 间 点 上 ， 状 态 刻 画 了 已 完成 的 结果 ， 以 及 未 完成 的 工作 总 量 。 例 如 ， 

当 k 为 3 且 total 为 2 时 ， 就 还 剩 下 两 个 式 子 没有 处 理 ，3 和 4 。 另 一 方面 ;fact 由 单 
一 参数 n 来 刻画 。 计 算 的 状态 完全 包含 在 表达 式 树 的 结果 中 ， 它 的 返回 值 起 到 total 的 作 
用 ， 并 且 在 不 同 的 帧 中 将 n 绑 定 到 不 同 的 值 上 ， 而 不 是 显 式 跟 踪 k 。 


递归 函数 可 以 更 加 依赖 于 解释 器 本 身 ， 通 过 将 计算 状态 储存 为 表达 式 树 和 环境 的 一 部 分 ， 而 
不 是 显 式 使 用 局 部 帧 中 的 名 称 。 出 于 这 个 原因 ， 递 归 函 数 通常 易于 定义 ， 因 为 我 们 不 需要 斌 
着 弄 清 必 须 在 迭代 中 维护 的 局 部 状态 。 另 一 方面 ， 学 会 弄 清 由 递归 函数 实现 的 计算 过 程 ， 需 
要 一 些 练习 。 


3.2.3 树 形 递 内 


另 一 个 递归 的 普遍 模式 叫做 树 形 递归 。 例 如 ， 考 虑 辈 波 那 契 序列 的 计算 ， 其 中 每 个 数值 都 是 
前 两 个 的 和 。 


>>> def fib(n): 
if n == 1: 


etwnnae 
return fib(n-2) + fib(n-1) 
>>> fib(6) 
5 


这 个 递归 定义 和 我 们 之 前 的 尝试 有 很 大 关系 : 它 准 确 反 映 了 辈 波 那 契 数 的 相似 定义 。 考 虑 求 
出 fib(6) 所 产生 的 计算 模式 ， 它 展示 在 下 面 。 为 了 计算 fib(6) ， 我 们 需要 计 

算 fib(5) 和 fib(4) 。 为 了 计算 fib(5) ， 我 们 需要 计算 fib(4) 和 fib(3) 。 通 常 ， 这 个 演 
化 过 程 看 起 来 像 一 棵 树 (下 面 的 图 并 不 是 完整 的 表达 式 树 ， 而 是 简化 的 过 程 描述 ; 一 个 完整 
的 表达 式 树 也 拥有 同样 的 结构 ) 。 在 遍历 这 棵 树 的 过 程 中 ， 每 个 蓝 点 都 表示 斐 波 那 契 数 的 已 
完成 计算 。 


fib(6) 
ee es “¥@ 
fib(4) @ fib(5) ”~ 
机 了 人 请 
fib(2) fib(3) 人 
四 3 i ; \ @. 
] 了 a Es fib(3) @ 2 fib(4) ~ 
Ee 弹 1 下 ; 和 pg Xe 车 * pg Nw 和 
, :fib(L) fib(2) :Fib(2) iD(3) 
0 la os 2 | 3 
0s ©” ， | : | ”ee 人 
: 0 本 人 2 
二 ”Ry 9@ ; 
、 0 1 ; 
”- 国 -------------。--。 @-- 


调用 自身 多 次 的 函数 叫做 树 形 递 昌 。 以 树 形 递 归 为 原型 编写 的 函数 十 分 有 用 ， 但 是 用 于 计算 
厘 波 那 回 数 则 非常 粮 糕 ， 因 为 它 做 了 很 多 重复 的 计算 。 要 注意 获 个 fib(4) 的 计算 是 重复 的 ， 
它 几 乎 是 一 半 的 工作 量 。 实 际 上 ， 不 难得 出 函数 用 于 计算 fip(1) 和 fip(2) (通常 是 树 中 的 
叶子 数量 ) 的 时 间 是 fib(n+1) 。 为 了 青 清 楚 这 有 多 糟糕 ， 我 们 可 以 证 明 fib(n) 的 值 随 

着 n 以 指数 方式 增长 。 所 以 ， 这 个 过 程 的 步骤 数量 随 输 入 以 指数 方式 增长 。 


我 们 已 经 见 过 斐 波 那 契 数 的 迭代 实现 ， 出 于 便利 在 这 里 贴 出 来 : 


>>>°" de tubnnter(n): 
prev, curr = 1, © # curr is the first Fibonacci number. 
for _ in range(n-1): 
prev, curr = curr, prev + curr 
return curr 


这 里 我 们 必须 维护 的 状态 由 当前 值 和 上 一 个 辈 波 那 契 数组 成 。 for 语句 也 显 式 跟踪 了 和 迭代 数 
量 。 这 个 定义 并 没有 像 递 归 方 式 那样 清晰 反映 裴 波 那 契 数 的 数学 定义 。 但 是 ， 和 迭代 实现 中 所 
需 的 计算 总 数 只 是 线性 ， 而 不 是 指数 于 n 的 。 甚 至 对 于 n 的 较 小 值 ， 这 个 差异 都 非常 大 


然而 我 们 不 应 该 从 这 个 差异 总 结 出 ， 树 形 递归 的 过 程 是 没有 用 的 。 当 我 们 考虑 层次 数据 结 
构 ， 而 不 是 数值 上 的 操作 时 ， 我 们 发 现 树 形 递归 是 自然 而 强大 的 工具 。 而 有 全， 树 形 过 程 可 以 
变 得 更 高 效 。 


记忆 。 用 于 提升 重复 计算 的 递归 函数 效率 的 机 制 叫做 记忆 。 记 忆 范 数 会 为 任何 之 前 接受 的 参 
数 储存 返回 值 。 fib(4) 的 第 二 次 调用 不 会 执行 与 第 一 次 同样 的 复杂 过 程 ， 而 是 直接 返回 第 一 
次 调用 的 已 储存 结果 。 


TM 饰 器 。 下 面 的 定义 为 之 前 的 已 计算 结果 创 
建 缓存 ， 由 被 计算 的 参数 索引 。 在 这 个 实现 中 ， 这 个 字典 的 使 用 需要 记忆 函数 的 参数 是 不 可 
变 的 。 


>>> def memo(f): 
"Returna memoized version of single=argument function fa 
cache = {} 
def memoized(n): 
fnmot naches 
cache[n] = f(n) 
return cache[n] 
return memoized 
>>> fib = memo(fib) 
>>> fib(40) 
63245986 


由 记忆 函数 节省 的 所 需 的 计算 时 间 总 数 在 这 个 例子 中 是 巨大 的 。 被 记忆 的 递归 函数 fip 和 选 
代 函 数 fib_iter 都 只 需要 线性 于 输入 n 的 时 间 总 数 。 为 了 计算 fib(49) ， fib 的 元 数 体 只 
执行 40 次 ， 而 不 是 无 记忆 递归 中 的 102,334,155 次 。 


空间 。 为 了 理解 函数 所 需 的 空间 ， 我 们 必须 在 我 们 的 计算 模型 中 规定 内 存 如 何 使 用 ， 
回收 。 在 求解 表达 式 过 程 中 ， 我 们 必须 保留 所 有 活动 环境 和 所 有 这 些 环境 引用 的 值 和 帧 。 
果 环 境 为 表达 式 树 当 前 分 支 中 的 一 些 表 达 式 提供 求 值 上 下 文 ， 那 么 它 就 是 活动 环境 。 


例如 ， 当 求 值 fib 时 ， 解 释 器 按 序 计算 之 前 的 每 个 值 ， 遍历 树 形 结构 。 为 了 这 样 做 ， 它 只 需 
要 在 计算 的 任何 时 间 点 ， 跟 踪 树 中 在 当前 节 ek 点 。 用 于 求 出 剩余 节点 的 内 存 可 
以 被 回收 ， 因 为 它 不 会 影响 未 来 的 计算 。 通 常 ， 树 形 递 归 所 需 空间 与 树 的 深度 成 正比 。 


下 面 的 图 示 描 述 了 由 求解 fib(3) i 。 在 求解 fib 最 初 调用 的 返回 表达 式 的 过 程 
中 ， fib(n-2) 被 求 值 ， 产生 值 0 。 一 旦 这 个 值 计 算出 来 ， 对 应 的 环境 帧 ( 标 为 灰色 ) 就 不 再 
需要 了 : 它 并 不 是 活动 环境 的 一 部 分 。 所 以 ， 一 个 设计 良好 的 解释 器 会 回收 用 于 储存 这 个 帧 
的 内 存 。 另 一 方面 ， 如 果 解 释 器 当前 正在 求解 fib(n-1) ， 那 么 由 这 次 fib 调用 (其 

中 为 2 ) 创建 的 环境 是 活动 的 。 与 之 对 应 ， 最 开始 在 3 上 调用 fib 所 创建 的 环境 也 是 活 
动 的 ， 因 为 这 个 值 还 没有 成 功 计算 出 来 。 


fib(3) 


return 0 






fib(n-2) fib(n-1) 
if n == if nm == 
i return 0 return 0 
ve/Lif n == 2: if n == 2: 


return 1 
return fib(n-2) + fib(n-1) 


return 1 


return fib(n-2) + fib(n-1) 





se 


rr 


在 memo 的 例子 中 ， 只 要 一 些 名 称 绑 定 到 了 活动 环境 中 的 某 个 函数 上 ， 关 联 到 所 返回 函数 ( 它 
包含 cache ) 的 环境 必须 保留 。 cache 字典 中 的 条 目 数 量 随 传 递 给 fib 的 唯一 参数 数量 线性 
增长 ， 它 的 规模 线性 于 输入 。 另 一 方面 ， 和 迭代 实现 只 需要 两 个 数值 来 在 计算 过 程 中 跟 

踪 : prev 和 curr ， 所 以 是 常数 大 小 。 


我 们 使 用 记忆 函数 的 例子 展示 了 编程 中 的 通用 模式 ， 即 通常 可 以 通过 增加 所 用 空间 来 减少 计 
算 时 间 ， 反 之 亦 然 。 


3.2.4 示例 : 找 零 


考虑 下 面 这 个 问题 : 如 果 给 你 半 美 元 、 四 分 之 一 美元 、 十 美 分 、 五 美 分 和 一 美 分 ， 一 美元 有 
多 少 种 找 零 的 方式 ? 更 通常 来 说 ， 我 们 能 不 能 编写 一 个 函数 ， 使 用 一 系列 货币 的 面额 ， 计 和 前 
有 多 少 种 方式 为 给 定 的 金额 总 数 找 零 ? 

这 个 问题 可 以 用 递归 函数 简单 解决 。 假 设 我 们 认为 可 用 的 硬币 类 型 以 某 种 顺序 排列 ， 假 设 从 
大 到 小 排列 。 

使 用 n 种 硬币 找 零 的 方式 为 : 


1. 使 用 所 有 除了 第 一 种 之 外 的 硬币 为 a 找 零 的 方式 ， 以 及 
2. 使 用 n 种 硬币 为 更 小 的 金额 a - d 找 零 的 方式 ， 其 中 d 是 第 一 种 硬币 的 面额 。 


为 了 弄 清楚 为 什么 这 是 正确 的 ， 可 以 看 出 ， 找 零 方 式 可 以 分 为 两 组 ， 不 使 用 第 一 种 硬币 的 方 
式 ， 和 使 用 它们 的 方式 。 所 以 ， 找 零 方 式 的 总 数 等 于 不 使 用 第 一 种 硬币 为 该 金额 找 零 的 方式 
数量 ， 加 上 使 用 第 一 种 硬币 至 少 一 次 的 方式 数量 。 而 后 者 的 数量 等 于 在 使 用 第 一 种 硬币 之 
后 ， 为 剩余 的 金额 找 零 的 方式 数量 。 


因此 ， 我 们 可 以 递归 将 给 定金 额 的 找 零 问题 ， 归 约 为 使 用 更 少 种 类 的 硬币 为 更 小 的 金额 找 零 
的 问题 。 和 仔细 考虑 这 个 归 约 原则 ， 并 且说 服 自 己 ， 如 果 我 们 规定 了 下 列 基本 条 件 ， 我 们 就 可 
以 使 用 它 来 描述 工法 : 


1 如果 a 正好 是 零 ， 那 么 有 一 种 找 零 方式 。 
2， 如 果 a 小 于 零 ， 那 么 有 零 种 找 零 方式 。 
3， 如果 n 小 于 零 ， 那 么 有 零 种 找 零 方 式 。 


我 们 可 以 轻易 将 这 个 描述 翻译 成 递归 函数 : 


>>> deficountschangelakands=( On25 ATLO 5 1)): 
"Returm themmnumber of rways to changeYamount ausingEcornkIndses 
if a == 0: 
ekuwmneL 
if a < 0 or len(kinds) == 0: 
negEunnno 
d = kinds[0] 
return count_change(a, kinds[1:]) + count_change(a - d, kinds) 
>>> count_change(100) 
292 


count_change 函数 生成 树 形 北 归 过 程 ， 和 fib 的 首 个 实现 一 样 ， 它 是 重复 的 。 它 会 花费 很 长 
时 间 来 计算 出 292 ， 除 非 我 们 记忆 这 个 函数 。 另 一 方面 ， 设 计 和 迭代 算法 来 计算 出 结果 的 方式 
并 不 是 那么 明显 ， 我 们 将 它 留 做 一 个 挑战 。 


3.2.5 增长 度 


前 面 的 例子 表明 ， 不 同 过 程 在 花费 的 时 间 和 空间 计算 资源 上 有 显著 差异 。 我 们 用 于 描述 这 个 
差异 的 便捷 方式 ， 就 是 使 用 增长 度 的 概念 ， 来 获得 当 输 入 变 得 更 大 时 ， 过 程 所 需 资 源 的 大 致 
度量 。 


令 n 为 度量 问题 规模 的 参数 ， R(n) 为 处 理 规模 为 n 的 问题 的 过 程 所 需 的 资源 总 数 。 在 我 们 
前 面 的 例子 中 ， 我 们 将 n 看 做 给 定 函 数 所 要 计算 出 的 数值 。 但 是 还 有 其 他 可 能 。 例 如 ， 如 果 
的 目标 是 计算 某 个 数值 的 平方 根 近 似 值 ， 我 们 会 将 n 看 做 所 需 的 有 效 位 数 的 数量 。 通 
， 有 一 些 问题 相关 的 特性 可 用 于 分 析 给 定 的 过 程 。 与 之 相似 ，R(n) 可 用 于 度量 所 用 的 内 存 
J 所 执行 的 基本 的 机 器 操作 数量 ， 以 及 其 它 。 在 一 次 只 执行 固定 数量 操作 的 计算 中 ， 用 
于 求解 表达 式 的 所 需 时 间 ， 与 求 值 过程 中 执行 的 基本 机 器 操作 数量 成 正比 。 


我 们 说 ，R(n) 具有 e(f(n)) 的 增长 度 ， 写 作 R(n)=0(f(n)) ( 读 作 “theta f(n) ") ， 如 果 存 在 
独立 于 n 的 常数 ki 和 ka ， 那 么 对 于 任何 足够 大 的 值 : 


k1i:f(n) <= R(n) <= k2.f(n) 


也 就 是 说 ， 对 于 较 大 的 n ， Rn) 的 值 夹 在 两 个 具有 f(n) 规模 的 值 之 间 : 


e 下 界 ki.f(n) ， 以 及 
e 上 界 k2.f(n) 。 


例如 ， 计 算 n! 所 需 的 步骤 数量 与 n 成 正比 ， 所 以 这 个 过 程 的 所 需 步 又 以 e(n) 增长 。 我 们 也 
看 到 了 ， 递 中 实现 fact 的 所 需 空 间 以 g(n) 增长 。 与 之 相反 ， 和 迭代 实现 fact_iter 花费 相似 
的 步骤 数量 ， 但 是 所 需 的 空间 保持 不 变 。 这 里 ， 我 们 说 这 个 空间 以 6(1) 增长 。 


人 的 辈 波 那 契 数 计 算 函 数 fib 的 步骤 数量 ， 随 输入 n 指数 增长 。 尤 其 是 ， 我 们 
可 以 发 现 ， 第 n 个 辈 波 那 契 数 是 距离 pA(n-2)/v5 的 最 近 整 数 ， 其 中 是 黄金 比例 : 


0 = (1+VvV5)/2 = 1.6180 


我 们 也 表示 ， 步 骤 数 量 随 返回 值 增长 而 增长 ， 所 以 树 形 递归 过 程 需 要 6(g^n) 的 步骤 ， 它 的 一 
个 随 n 指数 增长 的 函数 。 


增长 度 只 提供 了 过 程 行为 的 大 致 描述 。 例 如 ， 需 要 nn2 个 步骤 的 过 和 程 和 需要 1009.n^2 个 步 又 
的 过 程 ， 以 及 需要 3.nA2+10.n+17 个 步骤 的 过 程 都 拥有 e(n^2) 的 增长 度 。 在 特定 的 情况 下 ， 
增长 度 的 分 析 过 于 粗略 ， 不 能 在 函数 的 两 个 可 能 实现 中 做 出 判断 。 


但 是 ， 增 长 度 提供 了 实用 的 方法 ， 来 表示 在 改变 问题 规模 的 时 候 ， 我 们 应 如 何 预期 过 程 行为 
的 改变 。 对 于 g(n) (线性 ) 的 过 程 ， 使 规模 加 倍 只 会 使 所 需 的 资源 总 数 加 倍 。 对 于 指数 的 过 
程 ， 每 一 点 问题 规模 的 增长 都 会 使 所 用 资源 以 固定 因数 翻 倍 。 接 下 来 的 例子 展示 了 一 个 增长 
度 为 对 数 的 算法 ， 所 以 使 问题 规模 加 倍 ， 只 会 使 所 需 资源 以 固定 总 数 增加 。 


3.2.6 示例 : 求 寞 


考虑 对 给 定数 值 求 千 的 问题 。 我 们 布 望 有 一 个 函数 ， 它 接受 底数 b 和 正 整 数 指数 n 作为 参 
数 ， 并 计算 出 bn 。 一 种 方式 就 是 通过 递归 定义 : 


bAn 
b^0 


b.bA(n-1) 


这 可 以 翻译 成 递归 函数 : 


>>>°def “exp(br on 
if n == 0: 
ewan 
return b * exp(b, n-1) 


这 是 个 线性 的 递归 过 程 ， 需 要 g(n) 的 步骤 和 空间 。 就 像 阶 乘 那样 ， 我 们 可 以 编写 等 价 的 线性 
迭代 形式 ， 它 需要 相似 的 步骤 数量 ， 但 只 需要 固定 的 空间 。 


>>>°def exp Liter(b mn): 
result = 1 
for _ in range(n): 
result = result * b 
return result 


我 们 可 以 以 更 少 的 步骤 求 寺 ， 通 过 逐次 平方 。 例 如 ， 我 们 这 样 计 算 pn8 
b.(b.(b.(b.(b.(b.(b.b)))),),) 


我 们 可 以 使 用 三 次 乘法 来 计算 它 : 


b^2 = b.b 
bA4 = bA2.b^2 
bA8 = bA4,bA4 


这 个 方法 对 于 2 的 需 的 指数 工作 良好 。 我 们 也 可 以 使 用 这 个 递归 规则 ， 在 求 千 中 利用 逐步 平 
方 的 优点 : 


ri ia 这 
pn (P27)2 if pn is even 
| b:br! if nis odd 


我 们 同样 可 以 将 这 个 方式 表达 为 递归 函数 : 


>>> def Square(X): 
returnm Xx*x 
>>>"def fast exp(b, nn): 
if n == 0: 
ew 
if n % 2 == 0: 
return square(fast_exp(b, n//2)) 
else: 
return b * fast_exp(b, n-1) 
>>> fast_exp(2, 100) 
1267650600228229401496703205376 


fast_exp 所 生成 的 过 程 的 空间 和 步 步骤 数量 随 n 以 对 数 方式 增长 。 为 了 弄 清 楚 它 ， 可 以 看 出 ， 
使 用 fast_exp 计算 bs2n 比 计算 bn 只 需要 一 步 额外 的 乘法 操作 。 于 是 ， 我 们 能 够 计算 的 指 
数 大 小 ， 在 每 次 新 的 乘法 操作 时 都 会 (近似 ) 加倍。 所 以 ， 计 算 n 的 指数 所 需 乘法 操作 的 数 
量 ， 增 长 得 像 以 2 为 底 n 的 对 数 那样 慢 。 这 个 过 程 拥有 6(1og n) 的 增长 

度 。 ge(log n) 和 6(n) 之 间 的 差异 在 n 非常 大 时 变 得 显著 。 例 

如 ，n 为 10090 时 ， fast_exp 仅仅 需要 14 个 乘法 操作 ， 而 不 是 10006 。 


3.2 函数 和 所 生成 的 过 程 
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3.3 递归 数据 结构 


来 源 : 3.3 Recursive Data Structures 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


在 第 二 章 中 ， 我 们 引入 了 偶 对 的 概念 ， 作 为 一 种 将 两 个 对 象 结合 为 一 个 对 象 的 机 制 。 我 们 展 
示 了 偶 对 可 以 使 用 内 建 元 素来 实现 。 偶 对 的 封闭 性 表明 偶 对 的 每 个 元 素 本 身 都 可 以 为 偶 对 。 


这 种 封闭 性 允许 我 们 实现 递归 列表 的 数据 抽象 ， 它 是 我 们 的 第 一 种 序列 类 型 。 递 归 列 表 可 以 
使 用 递归 函数 最 为 自然 地 操作 ， 就 像 它 们 的 名 称 和 结构 表示 的 那样 。 在 这 一 节 中 ， 我 们 会 讨 
论 操作 递归 列表 和 其 它 递 归结 构 的 自 定义 的 函数 。 


3.3.1 处 理 递归 列表 


递归 列表 结构 将 列表 表示 为 首 个 元 素 和 列表 的 剩余 部 分 的 组 合 。 我 们 之 前 使 用 函数 实现 了 递 
归 列 表 ， 但 是 现在 我 们 可 以 使 用 类 来 重新 实现 。 下 面 ， 长 度 〈 _ len  ) 和 元 素 选 择 
( getitem_  ) 被 重 写 来 展示 处 理 递归 列表 的 典型 模式 。 


>>> class Rlist(object): 
Arecunriven larst Consrsting of ra furst element and the rest 
class EmptyList(object): 
def Lennn (self)s 
nekunneg 
empty = EmptyList() 
def init (self, first, rest=empty): 
self.first = first 
self.rest = rest 
def repr (self): 
args = repr(self.first) 
If Self,rest is not Rlist.empty: 
args += ', {0}'.format(repr(self.rest)) 
return 'Rlist({0})'.format(args) 
def Ten (self)E 
return 1 + len(self.rest) 
def detotemektseli 23: 
if i == 0: 
return self.first 
return self.rest[i-1] 


_ len 和 _getitem _ 的 定义 实际 上 是 递归 的 ， 虽 然 不 是 那么 明显 。Python 内 建 函 

数 len 在 自 定义 对 象 的 参数 上 调用 时 会 寻找 叫做 ”1en ”的 方法 。 与 之 类 似 ， 下 标 运 莫 符 会 

寻找 叫做 getitem ”的 方法 。 于 是 ， 这 些 定义 最 后 会 调用 对 象 自身 。 剩 余部 分 上 的 递归 调用 
是 递归 列表 处 理 的 普遍 模式 。 这 个 递归 列表 的 类 定义 与 Python 的 内 建 序列 和 打印 操作 能 够 合 
理 交 互 。 


>>> S = Rlist(1, Rlist(2, Rlist(3))) 
>>> s.rest 

Rlist(2, Rlist(3)) 

>>> len(s) 

3 

>>> s[1] 

2 


创建 新 列表 的 操作 能 够 直接 使 用 递归 来 表示 。 例 如 ， 我 们 可 以 定义 extend_rlist 函数 ， 它 接 
受 两 个 递归 列表 作为 参数 并 将 二 者 的 元 素 组 合 到 新 列表 中 。 


>>>>defmextendamLrst(st Ss) 
If si is Rlist.empty: 
eunEEs 之 
return Rlist(s1.first, extend_rlist(si.rest, s2)) 
>>> extend_rlist(s.rest, s) 
Rlist(2, Rlist(3, Rlist(1, Rlist(2, Rlist(3))))) 


与 之 类 似 ， 在 递归 列表 上 映射 函数 展示 了 相似 的 模式 : 


>>> def map_rilist(s, fn): 
if s is Rlist.empty: 
neuwnns 
return Rlist(fn(s.first), map_rlist(s.rest, fn)) 
>>> map_rlist(s, square) 
Rlist(1, Rlist(4, Rlist(9))) 


过 滤 操作 包括 额外 的 条 件 语句 ， 但 是 也 拥有 相似 的 递归 结构 。 


>>>°defrtalterirtist(s fn): 
If s is Rlist.empty: 
eduwnnes 
rest = filter_rlist(s.rest, fn) 
If fn(s.first): 
return Rlist(s.first, rest) 
return rest 
>>> filter_rlist(s, lambda x: x % 2 == 1) 
Rlist(1, Rlist(3)) 


列表 操作 的 递归 实现 通常 不 需要 局 部 赋值 或 者 while 语句 。 反 之 ， 递 归 列 表 可 以 作为 函数 调 
用 的 结果 来 拆 分 和 构造 。 所 以 ， 它 们 拥有 步骤 数量 和 所 需 空间 的 线性 增长 度 


3.3.2 后 层次 结 吉 构 


层次 结构 产生 于 数据 的 封闭 特性 ， 例 如 ， 元 组 可 以 包含 其 它 元 组 。 考 虑 这 个 数值 1 到 4 的 网 
套 表示 。 


2 
((1, 2), 3, 4) 


这 个 元 组 是 个 长 度 为 3 的 序列 ， 它 的 第 一 个 元 素 也 是 一 个 元 组 。 这 个 肯 套 结构 的 盒子 和 指针 
的 图 示 表 明 ， 它 可 以 看 做 拥有 四 个 叶子 的 树 ， 每 个 叶子 都 是 一 个 数值 。 





加 | 


在 树 中 ， 每 个 子 树 本 身 都 是 一 棵 树 。 作 为 基本 条 件 ， 任 何 本 身 不 是 元 组 的 元 素 都 是 一 个 简单 
的 树 ， 没 有 任何 枝 干 。 也 就 是 说 ， 所 有 数值 都 是 树 ， 就 像 在 偶 对 (1，2) 和 整个 结构 中 那样 。 


递归 是 用 于 处 理 树 形 结 构 的 自然 工具 ， 因 为 我 们 通常 可 以 将 树 的 操作 降 至 枝 干 的 操作 ， 它 会 
相应 产生 枝 干 的 枝 干 的 操作 ， 以 此 类 推 ， 直 到 我 们 到 达 了 树 的 叶子 。 例 如 ， 我 们 可 以 实 
现 count_leaves 欧 数 ， 它 返回 树 的 叶子 总 数 。 


>>> t = ((1, 2), 3, 4) 

>>> count_leaves(t) 

4 

>>> big_tree = ((t, t), 5) 

>>> big_tree 

((((1, 2), 3, 4), ((1, 2), 3, 4)), 5) 
>>> count_leaves(big_tree) 

9 


正如 map 是 用 于 处 理 序 列 的 强大 工具 ， 映 射 和 递归 一 起 为 树 的 操作 提供 了 强大 而 通用 的 计算 
形式 。 例 如 ， 我 们 可 以 使 用 高 阶 递归 函数 map_tree 将 树 的 每 个 叶子 平方 ， 它 的 结构 类 似 


于 count_leaves ° 


>>>"def map tree(tree, fn): 
If type(tree) != tuple: 
return fn(tree) 
return tuple(map_tree(branch, fn) for branch in tree) 
>>> map_tree(big_ tree, square) 
((((1, 4), 9, 16), ((1, 4), 9, 16)), 25) 


内 部 值 。 上 面 描述 的 树 只 在 叶子 上 存在 值 。 另 一 个 通用 的 树 形 结构 表示 也 在 树 的 内 部 节点 上 
存在 值 。 我 们 使 用 类 来 表示 这 种 树 。 


> Cliassmhree(object) 

def init (self, entry left=None, right=None): 
self.entry = entry 
self.left = left 
self.right = right 

def repr= (selfy): 
args = repr(self.entry) 
if Self,left or self.right: 

args += ', {0}, {1}'.format(repr(self.left), repr(self.right)) 

return 'Tree({0})'.format(args) 


例如 ， Tree 类 可 以 为 fib 的 递归 实现 表示 表达 式 树 中 计算 的 值 。 fib 函数 用 于 计算 莫 波 那 
契 数 。 下 面 的 函数 fib_tree(n) 返回 Tree ， 它 将 第 n 个 辈 波 那 契 树 作为 entry ， 并 将 所 有 之 
前 计算 出 来 的 辈 波 那 契 数 存 入 它 的 枝 干 中 。 


>>> "def fib tree(n): 
Returnma Tiree thatr represents arecursiVve Fibonacci calculatione 


if n == 1: 
return Tree(0) 
if n == 2: 


return Tree(1) 
left = fib_tree(n-2) 
right = fib_tree(n-1) 
return Tree(left.entry + right.entry, left, right) 
>>> fib_tree(5) 
Tree(3, Tree(1, Tree(0), Tree(1)), Tree(2, Tree(1), Tree(1, Tree(0), Tree(1)))) 


这 个 例子 表明 ， 表 达 式 树 可 以 使 用 树 形 结构 编程 表示 。 髓 套 表 达 式 和 树 形 数 据 结 构 的 联系 ， 
在 我 们 这 一 章 稍 后 对 解释 器 设计 的 讨论 中 起 到 核心 作用 。 


3.3.3 集合 


除了 列表 、 元 组 和 字典 之 外 ，Python 拥有 第 四 种 容器 类 型 ， 叫 做 set 。 集 合 字面 值 遵 循 元 素 
以 花 括 号 闭合 的 数学 表示 。 重 复 的 元 素 在 构造 中 会 移 除 。 集 合 是 无 序 容 器 ， 所 以 打印 出 来 的 
顺序 可 能 和 元 素 在 集合 字面 值 中 的 顺序 不 同 。 


SO 
>>> S 
{1, 2, 3, 4} 


Python 的 集合 支持 多 种 操作 ， 包 括 成 员 测试 、 长 度 计 算 和 标准 的 交集 并 集 操作 。 


>>> 3 in S 

True 

>>> len(s) 

4 

>>> s.union({1, 5}) 

{1, 2, 3, 4, 5} 

>>> s.intersection({6, 5, 4, 3}) 


{3, 4} 


除了 union 和 intersection ，Python 的 集合 还 支持 多 种 其 它 操作 。 断 

言 isdisjoint 、 issubset 和 issuperset 提供 了 集合 比较 操作 9 集合 是 可 变 的 3 并 且 可 以 使 
用 add 、 remove 、 discard 和 pop 一 次 修改 一 个 元 素 。 额 外 的 方法 提供 了 多 元 素 的 修改 ， 
例如 clear 和 update 。Python 集合 文档 十 分 详细 并 足够 易 懂 。 


实现 集合 。 抽 象 上 ， 集 合 是 不 同 对 象 的 容器 ， 支 持 成 员 测试 、 交 集 、 并 集 和 附加 操作 。 向 集 
合 添 加 元 素 会 返回 新 的 集合 ， 它 包含 原始 集合 的 所 有 元 素 ， 如 果 没 有 重复 的 话 ， 也 包含 新 的 
元 素 。 并 集 和 交集 运算 返回 出 现在 任意 一 个 或 两 个 集合 中 的 元 素 构 成 的 集合 。 就 像 任 何 数据 
抽象 那样 ， 我 们 可 以 随意 实现 任何 集合 表示 上 的 任何 函数 ， 只 要 它们 提供 这 种 行为 。 


在 这 章 的 剩余 部 分 ， 我 们 会 考虑 三 个 实现 集合 的 不 同方 式 ， 它 们 在 表示 上 不 同 。 我 们 会 通过 
分 析 集 合 操作 的 增长 度 ， 刻 画 这 些 不 同 表 示 的 效率 。 我 们 也 会 使 用 这 一 章 之 前 
的 Rlist 和 Tree 类 ， 它 们 可 以 编写 用 于 集合 元 素 操作 的 简单 而 优雅 的 递归 解决 方案 。 


作为 无 序 序列 的 集合 。 一 种 集合 的 表示 方式 是 看 做 没有 出 现 多 于 一 次 的 元 素 的 序列 。 空 集 由 
空 序列 来 表示 。 成 员 测试 会 递归 遍历 整个 列表 。 


>>> def empty(s): 
return s is Rlist.empty 
>>>" def set contains(s, Vv): 
-Ret Li and only i se Ss comauns ve 
If empty(s): 
neturn ealse 
elif s.first == V: 
neu ue 
return set_contains(s.rest, v) 
>>> s = Rlist(1, Rlist(2, Rlist(3))) 
>>> set_contains(s, 2) 
True 
>>> set_contains(s, 5) 
False 


这 个 set_contains 的 实现 需要 0(n) 的 时 间 来 测试 元 素 的 成 员 性 9 其 中 n 是 集合 s 的 大 小 。 
使 用 这 个 线性 时 间 的 成 员 测试 函数 ， 我 们 可 以 将 元 素 添 加 到 集合 中 ， 也 是 线性 时 间 。 


>>> def adjoin_ set(s, v): 
"Retumma setcontarning aul elLements of ss. andrelement eve 
If set_contains(s, v): 
releuwneEs 
return Rlist(v, s) 
>>> t = adjoin_set(s, 4) 
之 之 之 得 七 
Rlist(4, Rlist(1, Rlist(2, Rlist(3)))) 


那么 问题 来 了 ， 我 们 应 该 在 设计 表示 时 关注 效率 。 计 算 两 个 集合 set1 和 set2 的 交集 需要 成 
员 测 试 ， 但 是 这 次 每 个 setd 的 元 素 必 须 测 试 set2 中 的 成 员 性 ， 对 于 两 个 大 小 为 n 的 集合 ， 
这 会 产生 步骤 数量 的 平方 增长 度 g(n^2) 。 


>>>>、def intEensectlseE(tSsetl seE2) 
Returnma set recontarningnalL elements commonntorsetiandlset2. 
return filter_rlist(set1, lambda v: set contains(set2, v)) 

>>> intersect_ set(t, map_rlist(s, square)) 

Rlist(4, Rlist(1)) 


在 计算 两 个 集合 的 并 集 时 ， 我 们 必须 小 心 避免 两 次 包含 任意 一 个 元 素 。 union_set 函数 也 需 
要 线性 数量 的 成 员 测 试 ， 同 样 会 产生 包含 g(nA2) 步骤 的 过 程 。 


>>> def union set(set1, set2): 
"Returnassetreontarming abelements emther an set or set25 
set1 not set2 = filter_rlist(set1, lambda v: not set_contains(set2, v)) 
return extend_rlist(set1 not_set2, set2) 

>>> union_set(t, s) 

Rlist(4, Rlist(1, Rlist(2, Rlist(3)))) 


作为 有 序 元 组 的 集合 。 一 种 加 速 我 们 的 集合 操作 的 方式 是 修改 表示 ， 使 集合 元 素 北 增 排列 。 
为 了 这 样 做 ， 我 们 需要 一 些 比较 两 个 对 象 的 方式 ， 使 我 们 能 判断 哪个 更 大 。Python 中 ， 许 多 
不 同 对 象 类 型 都 可 以 使 用 < 和 > 运算 符 比 较 ， 但 是 我 们 会 专注 于 这 个 例子 中 的 数值 。 我 们 会 
通过 将 元 素 递增 排列 来 表示 数值 集合 。 


有 序 的 一 个 优点 会 在 set_contains 体现 : 在 检查 对 象 是 否 存 在 时 ， 我 们 不 再 需要 扫描 整个 集 
合 。 如 果 我 们 到 达 了 大 于 要 寻找 的 元 素 的 集合 元 素 ， 我 们 就 知道 这 个 元 素 不 在 集合 中 : 


>>> def Set_contains(S，V): 
if empty(s) or s.first > V: 
eunnnEsalse 
elif s.first == V: 
neu ue 
return set_contains(s.rest, v) 
>>> set_contains(s, 0) 
False 


这 节省 了 多 少 步 呢 ? 最 坏 的 情况 中 ， 我 们 所 寻找 的 元 素 可 能 是 集合 中 最 大 的 元 素 ， 所 以 步骤 
Re 同 。 另 一 方面 ， ge ae i 不 同 大 小 的 元 素 ， 我 们 可 以 预料 到 有 时 
我 们 可 以 在 列表 开头 的 位 置 停止 搜索 ， 其 它 情况 下 我 们 仍旧 需要 检测 整个 列表 。 平 均 上 我 们 
应 该 需要 检测 集合 中 一 半 的 元 素 。 所 以 ， 步 骤 数 量 的 平均 值 应 该 是 n/2 。 这 还 是 g(n) 的 增 
长 度 ， 但 是 它 确实 会 在 平均 上 为 我 们 节省 之 前 实现 的 一 半 步 骤 数 量 。 


我 们 可 以 通过 重新 实现 intersect_set 获取 更 加 可 观 的 速度 提升 。 在 无 序 表示 中 ， 这 个 操作 需 
要 g(n^2) 的 步 又， 因为 我 们 对 setl 的 每 个 元 素 执 行 set2 上 的 完整 扫描 。 但 是 使 用 有 序 的 
实现 ， 我 们 可 以 使 用 更 加 机 智 的 方式 。 我 们 同时 迭代 两 个 集合 ， 跟 踪 set1 中 的 元 

素 el 和 set2 中 的 元 素 ez 。 当 el 和 e2 相等 时 ， 我 们 在 交集 中 添加 该 元 素 。 


但 是 ， 假 设 el 小 于 ez ， 由 于 e2 比 set2 的 剩余 元 素 更 小 ， 我 们 可 以 立即 推断 出 ed 不 会 出 
现在 set2 剩余 部 分 的 任何 位 置 ， 因 此 也 不 会 出 现在 交集 中 。 所 以 ， 我 们 不 再 需要 考虑 el ， 
我 们 将 它 丢弃 并 来 到 set1 的 下 一 个 元 素 。 当 e2 < el 时 ， 我 们 可 以 使 用 相似 的 逻辑 来 步 

进 set2 中 的 元 素 。 下 面 是 这 个 函数 : 


之 >> 证 einhiEesecteEseteeET seE2)E 
If empty(set1) or empty(set2): 
return Rlist.empty 
el, e2 = set1.first, set2.first 
If el == e2: 
return Rlist(e1i, intersect_set(seti.rest, set2.rest)) 
ef el Me 
return intersect_set(seti1.rest, set2) 
(UN Me ts (a 
return intersect_set(set1, set2.rest) 
>>> intersect_set(s, s.rest) 
Rlist(2, Rlist(3)) 


为 了 估计 这 个 过 程 所 需 的 步骤 数量 ， 观 察 每 一 步 我 们 都 缩小 了 至 少 集合 的 一 个 元 素 的 大 小 。 
所 以 ， 所 需 的 步骤 数量 最 多 为 set1 和 set2 的 大 小 之 和 ， 而 不 是 无 序 表 示 所 需 的 大 小 之 积 。 
这 是 g(n) 而 不 是 6(n^2) 的 增长 度 -- 即使 集合 大 小 适中 ， 它 也 是 一 个 相当 可 观 的 加 速 。 例 

如 ， 两 个 大 小 为 166 的 集合 的 交集 需要 266 步 ， 而 不 是 无 序 表 示 的 10000 步 。 


表示 为 有 序 序列 的 集合 的 添加 和 并 集 操 作 也 以 线性 时 间 计 算 。 这 些 实现 都 留 做 练习 。 


作为 二 又 树 的 集合 。 我 们 可 以 比 有 序列 表 表 示 做 得 更 好 ， 通 过 将 几 个 元 素 重 新 以 树 的 形式 排 
列 。 我 们 使 用 之 前 引入 的 Tree 类 。 树 根 的 entry 持 有 集合 的 一 个 元 素 。 left 分 支 的 元 素 包 
括 所 有 小 于 树 根 元 素 的 元 素 。 right 分 支 的 元 素 包 括 所 有 大 于 树 根 元 素 的 元 素 。 下 面 的 图 展 
示 了 一 些 树 ， 它 们 表示 集合 {1，3，5，7，9，11} 。 相 同 的 集合 可 能 会 以 不 同形 式 的 树 来 表 
示 。 有 效 表示 所 需 的 唯一 条 件 就 是 所 有 left 子 树 的 元 素 应 该 小 于 entry ， 并 且 所 

有 right 子 树 的 元 素 应 该 大 于 它 。 


人 八 信 
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11 
树 形 表 示 的 优点 是 : 假设 我 们 打算 检查 v 是 否 在 集合 中 。 我 们 通过 将 v 于 entry 比较 开始 。 
如 果 v 小 于 它 ， 我 们 就 知道 了 我 们 只 需要 搜索 left 子 树 。 如 果 v 大 于 它 ， 我 们 只 需要 搜 
索 right 子 树 。 现 在 如 果树 是 “平衡 "的 ， 每 个 这 些 子 树 都 约 为 整个 的 一 半 大 小 。 所 以 ， 每 一 步 
中 我 们 都 可 以 将 大 小 为 n 的 树 的 搜索 问题 降 至 搜索 大 小 为 n/2 的 子 树 。 由 于 树 的 大 小 在 每 一 
步 减 半 ， 我 们 应 该 预料 到 ， 用 户 搜索 树 的 步骤 以 (log n) 增长 。 比 起 之 前 的 表示 ， 它 的 速度 
对 于 大 型 集合 有 可 观 的 提升 。 set_contains 函数 利用 了 树 形 集合 的 有 序 结 构 : 


1 


>>> def Set_contains(S，V): 
fs Ss Nonex 
iekEunnmEalse 
elif s.entry == V: 
retunmmne a ue 
efi es yenery <ave 
return set_contains(s.right, v) 
elif s.entry > v: 
return set_contains(s.left, v) 


向 集合 添加 元 素 与 之 类 似 ， 并 且 也 需要 g(1og n) 的 增长 度 。 为 了 添加 值 v_ ， 我 们 

将 v 与 entry 比较 ， 来 决定 v 应 该 添加 到 right 还 是 left 分 支 ， 以 及 是 否 已 经 将 v 添加 
到 了 合适 的 分 支 上 。 我 们 将 这 个 新 构造 的 分 支 与 原始 的 entry 和 其 它 分 支 组 合 。 如 果 v 等 
于 entry fe 就 可 以 返回 这 个 节点 。 如 果 我 们 被 要 求 将 v 添加 到 空 的 树 中 ， 我 们 会 生成 一 
个 Tree ， 它 包含 v 作为 entry ， 并 且 left 和 right 都 是 空 的 分 支 。 下 面 是 这 个 函数 : 


>>> def adjoin® Set(s, Vv): 
SS Nones 
return Tree(v) 
If s.entry == v: 
rekunmnes 
If s.entry < v: 
return Tree(s.entry, s.left, adjoin set(s.right, v)) 
If s.entry > v: 
return Tree(s.entry, adjoin set(s.left, v), s.right) 


>>> adjoin_set(adjoin_set(adjoin set(None, 2), 3), 1) 
Tree(2, Tree(1), Tree(3)) 


搜索 该 树 可 以 以 对 数 步骤 数量 执行 ， 我 们 这 个 叙述 基于 树 是 “平衡 "的 假设 。 也 就 是 说 ， 树 的 左 
子 树 和 右 子 树 都 拥有 相同 数量 的 相应 元 素 ， 使 每 个 子 树 含有 母树 一 半 的 元 素 。 但 是 我 们 如 何 
确定 ， 我 们 构造 的 树 就 是 平衡 的 呢 ? 即使 我 们 以 一 颗 平 衡 树 开 始 ， 使 用 adjoin_set 添加 元 素 
ee 生 不 平衡 的 结果 。 由 于 新 添加 的 元 素 位 置 取决 于 如 何 将 元 素 与 集合 中 的 已 有 元 素 比 

， 我们 可 以 预测 ， 如 果 我 们 “随机 "添加 元 素 到 树 中 ， 树 在 平均 上 就 会 趋向 于 平衡 。 


但 是 这 不 是 一 个 保证 。 例 如 ， 如 果 我 们 以 空 集 开 始 ， 并 向 序列 中 添加 1 到 7 了 7， 我 们 就 会 在 最 
后 得 到 很 不 平衡 的 树 ， 其 中 所 有 左 子 树 都 是 空 的 ， 所 以 它 与 简单 的 有 序列 表 相 比 并 没有 什么 
优势 。 一 种 解决 这 个 问题 的 方式 是 定义 一 种 操作 ， 它 将 任意 的 树 转换 为 具有 相同 元 素 的 平衡 
树 。 我 们 可 以 在 每 个 adjoin_set 操作 之 后 执行 这 个 转换 来 保证 我 们 的 集合 是 平衡 的 。 


交集 和 并 集 操作 可 以 在 树 形 集合 上 以 线性 时 间 执 行 ， 通 过 将 它们 转换 为 有 序 的 列表 ， 并 转换 
回来 。 细 节 留 做 练习 。 


Python 集合 实现 。Python 内 建 的 set 类 型 并 没有 使 用 上 述 任意 一 种 表示 。 反 之 ，Python 使 
用 了 一 种 实现 ， 它 的 成 员 测 试 和 添加 操作 是 (近似 ) 常量 时 间 的 ， 基 于 一 种 叫做 哈 希 ( 散 
列 ) 的 机 制 ， 这 是 其 它 课程 的 话题 。 内 建 的 Python 集合 不 能 包含 可 变 的 数据 类 型 ， 例 如 列 
表 、 字 典 或 者 其 它 集 合 。 为 了 能 够 误 套 集合 ，Python 也 提供 了 一 种 内 建 的 不 可 

变 frozenset 类 ， 除 了 可 变 操 作 和 运算 符 之 外 ， 它 拥有 和 set 相同 的 方法 。 


3.3 递归 数据 结构 
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3.4 异常 


来 源 : 3.4 Exceptions 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


程序 员 必 须 总 是 留意 程序 中 可 能 出 现 的 错误 。 例 子 数不胜数 : 一 个 函数 可 能 不 会 收 到 它 预 期 
的 信息 ， 必 需 的 资源 可 能 会 丢失 ， 或 者 网 络 上 的 连接 可 能 丢失 。 在 设计 系统 时 ， 程 序 员 必须 
预料 到 可 能 产生 的 异常 情况 并 且 采 取 适 当地 措施 来 处 理 它 们 。 


处 理 程序 中 的 错误 没有 单一 的 正确 方式 。 为 提供 一 些 持久 性 服务 而 设计 的 程序 ， 例 如 Web 服 
务 器 应 该 对 错误 健壮 ， 将 它们 记录 到 日 志 中 为 之 后 考虑 ， 而 且 在 尽 可 能 长 的 时 间 内 继续 接受 
新 的 请 求 。 另 一 方面 ，Python 解释 器 通过 立即 终止 以 及 打印 错误 信息 来 处 理 错误 ， 便 于 程序 
员 在 错误 发 生 时 处 理 它 。 在 任何 情况 下 ， 程 序 员 必 须 决 定 程序 如 何 对 异常 条 件 做 出 反应 。 


异常 是 这 一 节 的 话题 ， 它 为 程序 的 错误 处 理 提 供 了 通用 的 机 制 。 产 生 异 常 是 一 种 技巧 ， 终 止 
程序 正常 执行 流 ， 发 射 异常 情况 产生 的 信号 ， 并 直接 返回 到 用 于 响应 异常 情况 的 程序 的 封闭 
部 分 。Python 解释 器 每 次 在 检测 到 语句 或 表达 式 错误 时 抛 出 异常 。 用 户 也 可 以 使 

用 raise 或 assert 语句 来 抛 出 异常 村 


抛 出 异常 。 异 常 是 一 个 对 象 实例 ， En BaseException 类 。 第 一 章 引 入 
的 assert 语句 产生 AssertionError 类 的 异常 。 通常 ， 异常 实例 可 以 使 用 raise 语 句 来 抛 
出 。 raise 语 多 的 通用 形式 在 Python 文档 中 描述 。 raise 的 最 常见 的 作用 是 构造 异常 实例 
并 抛 出 它 。 


>>> raise Exception('An error occurred ' ) 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
Exception: an error occurred 


当 异 常 产生 时 ， 当 前 代码 块 的 语句 不 会 继续 执行 。 除 非 异 常 被 解决 了 (下面 会 描述 ) ， 解 释 
器 会 直接 返回 到 “ 读 取 - 求 值 -打印 ”交互 式 循环 中 ， 或 者 在 Python 以 文件 参数 启动 的 情况 下 会 
完全 终止 。 此 外 ， 解 释 器 会 打印 栈 回 滴 ， 它 是 结构 化 的 文本 块 ， 描 述 了 执行 分 支 中 的 一 系列 
诅 套 的 活动 函数 ， 它 们 是 异常 产生 的 位 置 。 在 上 面 的 例子 中 ， 文 件 名 称 <stdin> 表示 异常 由 
用 户 在 交互 式 会 话 中 产生 ， 而 不 是 文件 中 的 代码 。 


处 理 异 常 。 异 常 可 以 使 用 封闭 的 try 语句 来 处 理 。 try 语句 由 多 个 子 名 组成， 第 一 个 子 句 
以 try 开始 ， 剩 下 的 以 except 开始 。 


Gey 
<try suite> 

except <exception class> as <name>: 
<except suite> 


当 try 语句 执行 时 ， <try suite> 总 是 会 立即 执行 ° except 子 名 组 只 在 <try suite> 执行 过 
程 中 的 异常 产生 时 执行 。 每 个 except 子 句 指定 了 需要 处 理 的 异常 的 特定 类 。 例 如 ， 如 

果 <exception class> 是 AssertionError ， 那么 任何 继承 自 AssertionError 的 类 实例 都 会 被 处 
理 ， 标 识 符 <name> 绑 定 到 所 产生 的 异常 对 象 上 ， 但 是 这 个 绑 定 在 <except suite> 之 外 并 不 有 


例如 ， 我 们 可 以 使 用 try 语句 来 处 理 异 常 ， 在 异常 发 生 时 将 x 绑 定 为 0 。 


>>> try: 
x = 1/0 
except ZeroDivisionError as e: 
print('handling a', type(e)) 


x=0 
handling a <class 'ZeroDivisionError'> 
>>> x 
0 


try 语句 能 够 处 理 产 生 在 函数 体 中 的 异常 ， 函 数 在 <try suite> 中 调用 。 当 异常 产生 时 ， 控 
制 流 会 直接 跳 到 最 近 的 try 语句 的 能 够 处 理 该 异常 类 型 的 <except suite> 的 主体 中 。 


>>>>def invert(x): 
result = 1/x # Raises a ZeroDivisionError If x is 0 
prmt(Nevermprunted rh x 0 ) 
return result 
>>>>defrianvertsate(x): 
le 
return invert(x) 
except ZeroDivisionError as e: 
return str(e) 
>>> invert_safe(2) 
Never printed If x is 0 
Qe5 
>>> invert_safe(0) 
division by Zero 


这 个 例子 表明 ， invert 中 的 print 表达 式 永远 不 会 求 值 ， 反 之 ， 控 制 流 跳 到 了 handler 中 
的 except 子 名 组 中 。 将 zeropivisionError e 强制 转 为 字符 串 会 得 到 
由 handler: 'division by zero' 返回 的 人 类 可 读 的 字符 串 , 


3.4.1 开 常 对 得 


弄 常 对 象 本 身 就 带 有 属 小 性 ， 例 如 在 assert 语句 中 的 错误 信 息 ， 以 及 有 关 异 常 产生 处 的 信息 。 
用 户 定 义 的 异常 类 可 以 携带 额外 的 属性 。 


在 第 一 章 中， 我 们 实现 了 牛顿 法 来 寻找 任何 函数 的 零点 。 下 面 的 例子 定义 了 一 个 异常 类 ， 无 
论 何 时 valueError 出 现 ， 它 都 返 sw 测 值 。 数 学 错误 

( ValueError 的 一 种 ) 在 sqrt 在 负数 上 调用 时 产生 。 个 异常 由 抛 出 IterImproveError 处 
理 ， 它 将 牛顿 选 代 法 的 最 新 猜测 值 储存 为 参数 。 


首先 ， 我 们 定义 了 新 的 类 ， 继 承 自 Exception 。 


>>>° Class IterImproveError(Except1ion): 
def jnNnit (self, last guess): 
self.last_guess = last_guess 


下 面 ， 我 们 定义 了 IterImprove ， 我 们 的 通用 和 迭代 改进 算法 的 一 个 版 本 。 这 个 版 本 通过 抛 

出 TterImproveError 弄 常 ， 储 存 最 新 的 猜测 值 来 处 理 任 何 valueError 。 像 之 前 一 

样 ，iter_improve 接受 两 个 函数 作为 参数 ， 每 个 函数 都 接受 单一 的 数值 参数 。 update 函数 返 
回 新 的 猜测 值 ， 而 done 雹 数 返回 布尔 值 ， 表明 改进 是 否 收 化 到 了 正确 的 值 。 


>>> def iter_improve(update, done, guess=1, max_updates=1000): 
k=0 
GV 
while not done(guess) and k < max_updates : 
guess = update(guess) 
Kk = kK 二 革 
return guess 
except ValueError: 
raise IterImproveError(guess) 


最 后 ， 我 们 定义 了 find_root ， 它 返回 iter_improve 的 结果 。 iter SE 应 用 于 
由 newton_update 返回 的 牛顿 更 新 函数 。 newton_update 定义 在 第 一 章 ， 在 这 个 例子 中 无 需 任 
何 改变 。 find_root 的 这 个 版 本 通过 返回 它 的 最 后 一 个 猜 IterImproveError 。 


>>> def find root(f, guess=1): 
def done(x): 
return f(x) == 0 
Cl 
return iter_improve(newton _ update(f), done, guess) 
except IterImproveError as e: 
return e,last_guess 


考虑 使 用 find_root 来 寻找 2 * x ** 2 + sqrt(x) 的 零点 。 函数 的 一 个 零点 是 0 ， 但 是 
在 任何 负数 上 求解 它 会 产生 valueError 。 我 们 0 os 生 异 常 ， 并 且 不 能 返 
回 任何 零点 的 猜测 值 。 我 们 的 修订 版 实现 在 错误 之 前 返回 了 最 新 的 猜测 值 。 


>>> from math import sqrt 
>>> find_root(lambda x: 2*x*x + sqrt(x)) 
-0.030211203830201594 


虽然 这 个 近似 值 仍 昌 距 离 正 确 的 答案 6 很 远 ， 用 更 倾向 于 这 个 近似 值 而 不 


是 ValueError ° 


异常 是 另 一 个 技巧 ， 帮 助 我 们 将 程序 细节 划分 为 模块 化 的 部 分 。 在 这 个 例子 中 ，Python 的 弄 
常 机 制 允 许 我 们 分 离 和 迭代 改进 的 逻辑 ， 它 在 try 子 名 组 中 没有 发 生 改 变 ， 以 及 错误 处 理 的 逻 
辑 ， 它 出 现在 except 子 名 中。 我 们 也 会 发 现 ， 蜡 党 在 使 用 Python 实现 解释 器 时 是 个 非常 实 
用 的 特性 。 


3.5 组 合 语言 的 解释 器 


来 源 : 3.5 Interpreters for Languages with Combination 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


运行 在 任何 现代 计算 机 上 的 软件 都 以 多 种 编程 语言 写成 。 其 中 有 物理 语言 ， 例 如 用 于 特定 计 
算 机 的 机 器 语言 。 这 些 语言 涉及 到 基于 独立 储存 位 和 原始 机 器 指令 的 数据 表示 和 控制 。 机 器 
语言 的 程序 员 涉及 到 使 用 提供 的 硬件 ， 为 资源 有 限 的 计算 构建 系统 和 功能 的 高 效 实 现 。 高 阶 
语言 构建 在 机 器 语言 之 上 ， 隐 藏 了 表示 为 位 集 的 数据 ， 以 及 表示 为 原始 指令 序列 的 程序 的 细 
节 。 这 些 语言 拥有 例如 过 程 定义 的 组 合 和 抽象 的 手段 ， 它 们 适用 于 组 织 大 规模 的 软件 系统 。 


元 语言 抽象 -- 建立 了 新 的 语言 -- 并 在 所 有 工程 设计 分 支 中 起 到 重要 作用 。 它 对 于 计算 机 编程 
尤其 重要 ， 因 为 我 们 不 仅仅 可 以 在 编程 中 构想 出 新 的 语言 ， 我 们 也 能 够 通过 构建 解释 器 来 实 
现 它们 。 编 程 语言 的 解释 器 是 一 个 函数 ， 它 在 语言 的 表达 式 上 调用 ， 执 行 求解 表达 式 所 需 的 
操作 。 


我 们 现在 已 经 开始 了 技术 之 旅 ， 通 过 这 种 技术 ， 编 程 语言 可 以 建立 在 其 它 语言 之 上 。 我 们 首 
先 会 为 计算 器 定义 解释 器 ， 它 是 一 种 受 限 的 语言 ， 和 Python 调用 表达 式 具 有 相同 的 语法 。 我 
们 之 后 会 从 零 开 始 开 发 Scheme 和 Logo 语言 的 解释 器 ， 它 们 都 是 Lisp 的 方言 ，Lisp 是 现在 
仍旧 广泛 使 用 的 第 二 老 的 语言 。 我 们 所 创建 的 解释 器 ， 在 某 种 意义 上 ， 会 让 我 们 使 用 Logo 编 
写 完 全 通用 的 程序 。 为 了 这 样 做 ， 它 会 实现 我 们 已 经 在 这 门 课 中 开发 的 求 值 环境 模型 。 


pp 


3.5.1 计算 器 


我 们 的 第 一 种 新 语言 叫做 计算 器 ， 一 种 用 于 加 减 夹 除 的 算术 运算 的 表达 式 语言 。 计 算 器 拥有 
Python 调用 表达 式 的 语法 ， 但 是 它 的 运算 符 对 于 所 接受 的 参数 数量 更 加 灵活 。 例 如 ， 计 算 器 
运算 符 mul 和 add 可 接受 任何 数量 的 参数 : 


calc> add(1, 2, 3, 4) 
10 
calc> mul() 


A 


算 符 ， 它 会 对 运算 符 取 反 。 传 入 至 少 两 个 ， 它 会 从 第 
符 拥 有 Python 的 operator.truediv 的 语义 ， 只 接受 


sub 运算 符 拥 有 两 种 行为 : 传 入 一 个 运 
一 个 参数 中 减 掉 剩 余 的 参数 。 div 运算 
两 个 参数 。 


Calc>EEsub (9 23 
4 

calc> sub(3) 

-3 


calc> div(15, 12) 
25 


就 像 Python 中 那样 ， 调 用 表达 式 的 退 套 提供 了 计算 器 语言 中 的 组 合 手段 。 为 了 精简 符号 ， 我 
们 使 用 运算 符 的 标准 符号 来 代替 名 称 : 


calc> sub(100, mul(7, add(8, div(-12, -3)))) 


calc> -(100, *(7, +(8, /(-12, -3)))) 


我 们 会 使 用 Python 实现 计算 器 解释 器 。 也 就 是 说 ， 我 们 会 编写 Python 程序 来 接受 字符 串 作 
为 输入 ， 并 返回 求 值 结 果 。 如 果 输 入 是 符合 要 求 的 计算 器 表达 式 ， 结 果 为 字符 串 ， 反 之 会 产 
生 合 适 的 异常 。 计 算 器 语言 解释 器 的 核心 是 叫做 calc eval 的 递归 函数 ， 它 会 求解 树 形 表达 
式 对 象 。 


表达 式 树 。 到 目前 为 止 ， 我 们 在 描述 求 值 过 程 中 所 引用 的 表达 式 树 ， 还 是 概念 上 的 实体 。 我 
们 从 没有 显 式 将 表达 式 树 表示 为 程序 中 的 数据 。 为 了 编写 解释 器 ， 我 们 必须 将 表达 式 当 做 数 
据 操 作 。 在 这 一 章 中 ， 许 多 我 们 之 前 介绍 过 的 概念 都 会 最 终 以 代码 实现 。 


计算 器 中 的 基本 表达 式 只 是 一 个 数值 ， 类 型 为 int 或 float 。 所 有 复合 表达 式 都 是 调用 表达 
式 。 调 用 表达 式 表示 为 拥有 两 个 属性 实例 的 Exp 类 。 计 算 器 的 operator 总 是 字符 串 : 算数 运 
算 符 的 名 称 或 符号 。 operands 要 么 是 基本 表达 式 ， 要 么 是 Exp 的 实例 本 身 。 


>>>° Classy Exp(object 
-Acaliexpresstion in Calculator se 
def init (self, operator, operands): 
self.operator = operator 
self.operands = operands 
def repranl(seLf): 
return 'Exp({0}, {1})'.format(repr(self.operator), repr(self.operands)) 
def Stlselnk 
operand_strs = ', '.join(map(str, self.operands)) 
return '{0}({1})'.format(self.operator, operand_strs) 


Exp 实例 定义 了 两 个 字符 串 方法 。 _repr ”方法 返回 Python 表达 式 ， 而 _ str 方法 返回 


计算 器 表达 式 。 


> 二 EXDi(uadd [22]) 

Exp('add', [1i, 2]) 

>>> str(Exp('add', [1, 2])) 

'add(1, 2)" 

>>> Exp('add', [1, Exp('mul', [2, 3, 4])]) 
Exp('add', [1, Exp('mul', [2, 3, 4])]) 

>>> str(Exp('add', [1, Exp('mul', [2, 3, 4])])) 
vaddi( mu 2 


最 后 的 例子 演示 了 Exp 类 如 何 通 过 包含 作为 operands 元 素 的 Exp 的 实例 ， 来 表示 表达 式 树 
中 的 层 次 结构 9 


求 值 ° calc_ eval 函数 接受 表达 式 作为 参数 并 返回 它 的 值 S 它 根据 表达 式 的 形 式 为 表达 式 
分 类 ， 并 且 指 导 它 的 求 值 。 对 于 计算 器 来 说 ， 表达 式 的 两 种 句法 形式 是 数值 或 调用 表达 式 ， 
后 者 是 Exp 的 实例 。 数 值 是 自 求 值 的 ， 它 们 可 以 直接 从 calc_eval 中 返回 。 调 用 表达 式 需 要 
使 用 函数 。 


调用 表达 式 首先 通过 将 calc_eval 函数 递归 映射 到 操作 数 的 列表 ， 计 算出 参数 列表 来 求 值 。 
之 后 ， 在 第 二 个 函数 calc_apply 中 ， 运 算 符 会 作用 于 这 些 参数 上 。 


计算 器 语言 足够 简单 ， 我 们 可 以 轻易 地 在 单一 函数 中 表达 每 个 运算 符 的 使 用 逻辑 。 
在 calc_apply 中 ， 每 种 条 件 子 名 对 应 一 个 运算 符 


>>> from operator import mul 
>>> from functools import reduce 
>>> def calc apply(operator, args): 
Apply thenmamedioperator torae lrstrof argse 


If operator in ('add', '+'): 
return sum(args) 
fonerator msu AR 全 )i 


if len(args) == 0: 
raise TypeError(operator + ' requires at least 1 argument') 
If len(args) == 1: 
return -args[0] 
return sum(args[:1] + [-arg for arg in args[1:]]) 
foneratoreamn( mu 
return reduce(mul, args, 1) 
Onerator me nv 全 的 1 
If len(args) != 2: 
raise TypeError(operator + ' requires exactly 2 arguments') 
numer, denom = args 
return numer/denom 


上 面 ， 每 个 语句 组 计算 了 不 同 运算 符 的 结果 ， 或 者 当 参 数 错误 时 产生 合适 
的 TypeError 。 calc_apply 函数 可 以 直接 调用 ， 但 是 必须 传 入 值 的 列表 作为 参数 ， 而 不 是 运 
算 符 表达 式 的 列表 。 


>5> cale apply('+", [1 2, 3]) 


6 
>>> calc_apply('-', [10, 1, 2, 3]) 
4 
>>> calc_apply('*', []) 
全 
>>> calc apply('/', [40, 5]) 
SU 
calc_eval 的 作用 是 ， 执 行 合适 的 calc_apply 调用 ， 通 过 首先 计算 操作 数 子 表达 式 的 值 ， 之 


后 将 它们 作为 参数 传 入 calc_apply 。 于 是 ， calc_eval 0 套 表达 式 。 


>>> e = Exp('add', [2, Exp('mul', [4, 6])]) 
>>> str(e) 

add(2. muL(4. 6) 

>>> Calc_eval(e) 

26 


Calc_eval 的 结构 是 个 类 型 (表达 式 的 形式 ) 分 发 的 例子 第 一 种 表达 式 是 数值 押 不 需要 任 
何 的 额外 求 值 步骤 。 通 常 ， 基 本 表达 式 不 需要 任何 额外 的 求 值 步骤 ， 这 叫做 自 求 值 。 计 算 器 
语言 中 唯一 的 自 求 值 表达 式 就 是 数值 ， 但 是 在 通用 语言 中 可 能 也 包括 字符 串 、 布 尔 值 ， 以 及 
其 它 。 


“ 读 取 - 求 值 -打印 ”循环 。 和 解释 器 交互 的 典型 方式 是 “ 读 取 - 求 值 -打印 "循环 (REPL) ， 它 是 一 
种 交互 模式 ， 读 取 表 达 式 、 对 其 求 值 ， 之 后 为 用 户 打印 出 结果 。Python 交互 式 会 话 就 是 这 种 
循环 的 例子 。 


REPL 的 实现 与 所 使 用 的 解释 器 无 关 。 下 面 的 read eval print_loop 函数 使 用 内 建 的 input 函 
数 ， 从 用 户 接受 一 行文 本 作为 输入 。 它 使 用 语言 特定 的 calc_parse 函数 构建 表达 式 

树 。 calc_parse 在 随后 的 解析 一 节 中 定义 © 最 后 ， 它 打 印 出 对 由 calc_parse 返回 的 表达 式 树 
调用 calc_eval 的 结果 。 


>>> def readr eval print loop(): 
"Run a read-eval-print loop for calculator.™"™™"" 
while True: 
expression_tree = calc_parse(input('calc> ')) 
print(calc_eval(expression_tree)) 


read_eval print_loop 的 这 个 版 本 包含 所 有 交互 式 界 面 的 必要 组 件 。 一 个 样 例会 话 可 能 像 这 
样 : 

calc> mul(1, 2, 3) 

6 


calc> add() 
0 


calc> add(2, div(4, 8)) 
2 


这 个 循环 没有 实现 终端 或 者 错误 处 理 机 制 。 我 们 可 以 通过 向 用 户 报告 错误 来 改进 这 个 界面 。 
我 们 也 可 以 允许 用 户 通过 发 射 键 盘 中 断 信号 〈 control-c ) ， 或 文件 末尾 信号 ( control-D ) 
来 退出 循环 。 为 了 实现 这 些 改进 ， 我 们 将 原始 的 while 语句 组 放 在 try 语句 中 。 第 一 

从 except 子 名 处理 了 由 calc_parse 产生 的 SyntaxError 异常 ， 也 处 理 了 由 calc_eval 产生 


的 TypeError 和 zeroDivisionError 异常 


>>>>def readeval print Loop() 
"" Runamread eval print loopi forcalcuwtlator 
whade nn ues 
EV 
expression_ tree = calc parse(input('calc> ')) 
print(calc_eval(expression_tree)) 
except (SyntaxError, TypeError, ZeroDivisionError) as err: 


print(type(err). name + ':', err) 

except (KeyboardInterrupt, EOFError): # <Control>-D, etc. 
print('Calculation completed.') 
return 


这 个 循环 实现 报告 错误 而 不 退出 循环 。 ee ， 而 是 在 错误 消息 之 后 重新 开 
台 循 环 可 以 让 用 户 回 顾 他 们 的 表达 式 。 通 过 导入 readline 模块 ， 用户 其 至 可 以 使 用 上 箭头 
或 control-P 来 回忆 他 们 之 前 的 输入 。 ny 吉 果 提供 了 错误 信息 报告 的 界面 : 


calc> add 

SyntaxError: expected ( after add 

calc> div(5) 

TypeError: div requires exactly 2 arguments 
calc> div(1, 0) 

ZeroDivisionError: division by zero 

calc> ^DCalculation completed. 


在 我 们 将 解释 器 推广 到 计算 器 之 外 的 语言 时 ， 我 们 会 看 到 ， read_eval print_loop 由 解析 郊 
《、 求 值 济 数 ， 和 由 try 语句 处 理 的 异常 类 型 参数 化 。 除 了 这 些 修改 之 外 ， 任 何 REPL 都 可 
以 使 用 相同 的 结构 来 实现 。 


3.5.2 解析 


解析 是 从 原始 文本 输入 生成 表达 式 树 的 过 程 。 解 释 这 些 表 达 式 树 是 求 值 函数 的 任务 ， 但 是 解 
析 器 必须 提供 符合 格式 的 表达 式 树 给 求 值 器 。 解 析 器 实际 上 由 两 个 组 件 组 成 ， 词 法 分 析 器 和 
语法 分 析 器 。 首 先 ， 词 法 分 析 器 将 输入 字符 串 拆 成 标记 (token) ， 它 们 是 语言 的 最 小 语法 单 
元 ， 就 像 名 称 和 符号 那样 。 其 次 ， 语 法 分 析 器 从 这 个 标记 序列 中 构建 表达 式 树 。 


>>> def calc parse(Jline): 
"parse a line of calculator input and return an expression tree.™"" 
tokens = tokenize(line) 
expression_tree = analyze(tokens) 
If len(tokens) > 0: 
raise SyntaxError('Extra token(s): 
return expression_tree 


"+ '"' '.join(tokens)) 


标记 序列 由 叫做 tokenize 的 词法 分 析 器 产生 ， 并 被 叫做 analyze 语法 分 析 器 使 用 。 这 里 
们 定义 了 calc ， 它 只 接受 符合 格式 的 计算 器 表达 式 。 一 些 语言 的 解析 器 为 接受 以 

符 、 分 号 或 空格 分 隔 的 多 种 表达 式 而 设计 。 我 们 在 引入 Logo 语言 之 前 会 推迟 实现 这 en 
小 Le] 


词法 分 析 。 用 于 将 字符 串 解 释 为 标记 序列 的 组 件 叫 做 分 词 器 〈tokenizer ) ， 或 者 词法 分 析 
器 。 在 我 们 的 视线 中 ， 分 词 器 是 个 叫做 tokenize 的 函数 。 计 算 器 语言 由 包含 数值 、 运 算 符 名 
称 和 运算 符 类 型 的 符号 (比如 + ) 组 成 。 这 些 符号 总 是 由 两 种 分 隔 符 划分 : 运 号 和 国 括 号 。 
每 个 符号 本 身 都 是 标记 ， 就 像 每 个 喜 号 和 圆 括号 那样 。 标 记 可 以 通过 向 输入 字符 串 添 加 空 
格 ， 之 后 在 每 个 空格 处 分 割 字符 囊 来 分 开 。 
>>> def tokenize(line): 
-Converec arStmna Lintonamse or EoKkenmsm 


spaced = Tinesreplace( (Replace( .0 replace(l, 
return spaced.split() 


对 符合 格式 的 计算 器 表达 式 分 词 不 会 损坏 名 称 ， 但 是 会 分 开 所 有 符号 和 分 隔 符 。 


>>> tokenize('add(2, mul(4, 6))') 
Ladde, 人 2 De um 人 we A “60 0 | 


拥有 更 加 复合 语法 的 语言 可 能 需要 更 复杂 的 分 词 器 。 特 别 是 ， 许 多 分 析 器 会 解析 每 种 返回 标 
记 的 语法 类 型 。 例 如 ， 计 算 机 中 的 标记 类 型 可 能 是 运算 符 、 名 称 、 数 值 或 分 隔 符 。 这 个 分 类 


可 以 简化 标记 序列 的 解析 。 


语法 分 析 。 将 标记 序列 解释 为 表达 式 树 的 组 件 叫做 语法 分 析 器 。 在 我 们 的 实现 中 ， 语 法 分 析 
由 叫做 analyze 的 递归 函数 完成 。 它 是 递归 的 ， 因 为 分 析 标记 序列 经 常 涉 及 到 分 析 这 些 表达 
式 树 中 的 标记 子 序 列 ， 它 本 身 作 为 更 大 的 表达 式 树 的 子 分 支 ( 比 如 操作 数 ) 。 递 归 会 生成 由 
求 值 器 使 用 的 层次 结构 。 


analyze 函数 接受 标记 列表 ， 以 符合 格式 的 表达 式 开始 。 它 会 分 析 第 一 个 标记 ， 将 表示 数值 
的 字符 串 强 制 转换 为 数字 的 值 。 之 后 要 考虑 计算 机 中 的 两 个 合法 表达 式 类 型 。 数 字 标 记 本 身 
就 是 完整 的 基本 表达 式 树 。 复 合 表达 式 以 运 彰 符 开 始 ， 之 后 是 操作 数 表达 式 的 列表 ， 由 圆 括 
号 分 隔 。 我 们 以 一 个 不 检查 语法 错误 的 实现 开始 。 


>>> def analyze(tokens ) : 
”Create a tree of nested lists from a sequence of tokens."™™" 
token = analyze_token(tokens.pop(0)) 
if type(token) in (int, float): 
return token 
else 
tokens.pop(0) # Remove (人 
return Exp(token, analyze_operands(tokens)) 
>>> def analyze_operands(tokens ) : 
ReadEaElistof comnasseparatediioperandsa 
operands = [] 
while tokens[0] != ')': 
if operands: 
tokens.pop(0) # Remove ， 
operands .append(analyze(tokens ) ) 
tokens.pop(0) # Remove ) 
return operands 


， 我 们 需要 实现 analyze_token 。 analyze_token 函数 将 数值 文本 转换 为 数值 。 我 们 并 不 
自己 实现 这 个 逻辑 ， 而 是 依靠 内 建 的 Python 类 型 转换 ， 使 用 int 和 float 构造 器 来 将 标记 
转换 为 这 种 类 型 。 


>>> def analyze_token(token) : 
"Return the value of token if it can be analyzed as a number, ‘or token 
Cm 
return int(token) 
except (TypeError, ValueError): 
EV 
return float(token) 
except (TypeError, ValueError): 
return token 


我 们 的 analyze 实现 就 完成 了 。 它 能 够 正确 将 符合 格式 的 计算 器 表达 式 解析 为 表达 式 树 。 这 
些 树 由 str 函数 转换 回 计 算 器 表达 式 。 


>>> expression = 'add(2, mul(4, 6))'" 
>>> analyze(tokenize(expression)) 
Exp('add', [2, Exp('mul', [4, 6])]) 
>>> str(analyze(tokenize(expression))) 
'add(2, mul(4, 6))" 


analyse 此 函数 只 会 回 符合 格式 的 表达 式 树 ， 并 且 它 必须 检 测 输 入 中 的 语 法 错误 。 特别 是 ， 
pp 5 完整、 正确 分 隔 ， 以 及 只 含有 已 知 的 运算 符 。 下 面 的 修订 版 本 确保 了 
语法 分 析 的 每 一 步 都 找到 了 预期 的 标记 。 


>>> known_operators = ['add', 'sub’', 'mul', 'div’', '+', '-', '*', '/'] 
>>> def analyze(tokens): 
"GCreateratree of nestednlasts troma sequence of tokense 
assert_non_empty(tokens) 
token = analyze_token(tokens.pop(0)) 
if type(token) in (int, float): 
return token 
If token in known_operators: 
If len(tokens) == 0 or tokens.pop(0) != '(': 
raise SyntaxError('expected ( after ' + token) 
return Exp(token, analyze_operands(tokens)) 
else' 
raise SyntaxError('unexpected ' + token) 
>>> def analyze_operands(tokens): 
"""Analyze a sequence of comma-separated operands.""" 
assert_non_empty(tokens) 
operands = [] 
while tokens[0] != ')'": 
If operands and tokens.pop(0) != ',': 
raise SyntaxError('expected ,') 
operands .append(analyze(tokens ) ) 
assert_non_empty(tokens ) 
tokens.pop(0) # Remove ) 
return elements 
>>> def assert_non_empty(tokens ) : 
-Rarse anexeeptuon itorense ns emty 
if len(tokens) == 
raise SyntaxError('unexpected end of line') 


大 量 的 语法 错误 在 本 质 上 提升 了 解释 器 的 可 用 性 。 在 上 面 ， syntaxError 异常 包含 所 发 生 的 问 
题 描述 。 这 些 错误 字符 串 也 用 作 这 些 分 析 函 数 的 定义 文档 。 
这 个 定义 完成 了 我 们 的 计算 器 解释 器 。 你 可 以 获取 单独 的 Python 3 源码 calc.py 来 测试 。 我 
人 误 健壮 ， 用 户 在 calc> 提示 符 后 面 的 每 个 输入 都 会 求 值 为 数值 ， 或 者 产生 合 
适 的 错误 ， 描 述 输入 为 什么 不 是 符合 格式 的 计算 器 表达 式 。 


V 


3.6 抽象 语言 的 解释 器 


来 源 : 3.6 Interpreters for Languages with Abstraction 
译 者 : 飞龙 
协议 : CC BY-NC-SA 4.0 


语言 提供 了 一 种 手段 ， 来 组 合 一 些 吝 套 的 调用 表达 式 。 然 而 ， 我 们 却 没有 办 法 定义 新 
符 ， 将 值 赋 给 名 称 ， 或 者 表达 通用 的 计算 方法 。 总 之 ， 计 算 器 并 不 以 任何 方式 支持 抽 
以 ， 它 并 不 是 特别 强大 或 通用 的 编程 语言 。 我 们 现在 转 到 定义 一 种 通用 编程 语言 的 任 
务 中 ， 这 门 语言 通过 将 名 称 绑 定 到 值 以 及 定义 新 的 操作 来 支持 抽象 。 


计算 器 
的 运算 
所 


我 们 并 不 是 进一步 扩展 简单 的 计算 器 语言 ， 而 是 重新 开始 ， 并 且 为 Logo 语言 开发 解释 器 。 
Logo 并 不 是 为 这 门 课 发 明 的 语言 ， 而 是 一 种 经 典 的 命令 式 语 言 ， 拥 有 许多 解释 器 实现 和 自己 
的 开发 者 社区 。 


上 一 章 ， 我 们 将 完整 的 解释 器 表示 为 Python 源码 ， 这 一 章 使 用 描述 性 的 方式 。 某 个 配套 工程 
需要 你 通过 构建 完整 的 Logo 函数 式 解释 器 来 实现 这 里 展示 的 概念 。 


3.6.1 Scheme 语言 


Scheme 是 Lisp 的 一 种 方言 ，Lisp 是 现在 仍 在 广泛 使 用 的 第 二 老 (在 Fortran 之 后 ) 的 编程 
语言 。Scheme 首 次 在 1975 年 由 Gerald Sussman 和 Guy Steele 描述 。Revised(4) Report 
on the Algorithmic Language Scheme 的 引言 中 写 道 : 


编程 语言 不 应 该 通过 堆砌 特性 ， 而 是 应 该 通过 移 除 那些 使 额外 特性 变 得 必要 的 缺点 和 限 
制 来 设计 。Scheme 表明 ， 用 于 组 成 表达 式 的 非常 少量 的 规则 ， 在 没有 组 合 方式 的 限制 
的 情况 下 ， 足 以 组 成 实用 并 且 高 效 的 编程 语言 ， 它 足够 灵活 ， 在 使 用 中 可 以 支持 多 数 当 
今 的 主流 编程 范式 。 
我 们 将 这 个 报告 推荐 给 你 作为 Scheme 语言 的 详细 参考 。 我 们 这 里 只 会 涉及 重点 。 下 面 的 描 
述 中 ， 我 们 会 用 到 报告 中 的 例子 。 
虽然 Scheme 非常 简单 ， 但 它 是 一 种 丨 正 的 编程 语言 ， 在 许多 地 方 都 类 似 于 Python， 但 
是 “语法 糖 [1 会 尽量 少 。 基 本 上 ， 所 有 运算 符 都 是 函数 调用 的 形式 。 这 里 我 们 会 描述 完整 的 
Scheme 语言 的 在 报告 中 描述 的 可 展示 的 子 集 。 
[1] 非常 遗憾 ， 这 对 于 Scheme 语言 的 最 新 版 本 并 不 成 立 ， 就 像 Revised(6) Report 中 的 
那样 。 所 以 这 里 我 们 仅仅 针对 之 前 的 版 本 。 


Scheme 有 多 种 可 用 的 实现 ， 它 们 添加 了 额外 的 过 程 。 在 UCB， 我 们 使 用 Stk 解释 器 的 一 个 
修改 版 ， 它 也 在 我 们 的 教学 服务 器 上 以 stk 提供 。 不 幸 的 是 ， 它 并 不 严格 遵守 正式 规范 ， 但 
它 可 用 于 我 们 的 目的 。 


使 用 解释 器 。 就 像 Python 解释 器 [2] 那 样 ， 向 Stk 键入 的 表达 式 会 由 " 读 取 - 求 值 -打印 "循环 求 
值 并 打印 : 


>>> 3 

2 (- (/ (* (+ 3 7 10) (- 1000 8)) 992) 17) 

(define (fib n) (if (<n 2) n (+ (fib (- n 2)) (fib (- n 1))))) 
da '(1 (7 19)) 

(1 (7 19)) 


[2] 在 我 们 的 例子 中 ， 我 们 使 用 了 和 Python 相同 的 符号 >>> 和 ... ， 来 表示 解释 器 的 输 
入 行 ， 和 非 前 组 输出 的 行 。 实 际 上 ，Scheme 解释 器 使 用 不 同 的 提示 符 。 例 如 ，Stk 
以 sTk> 来 提示 ， 并 且 不 提示 连续 行 。 然 而 Python 的 惯例 使 输入 和 输出 更 加 清晰 。 


Scheme 中 的 值 。Scheme 中 的 值 通常 与 Python 对 应 。 
布尔 值 


昌 值 和 假 值 ， 使 用 #t 和 #f 来 表示 。Scheme 中 唯一 的 假 值 (按照 Python 的 含义 ) 就 
#f 。 


za 


数值 


这 包括 任意 精度 的 整数 、 有 理 数 、 复 数 ， 和 "不 精确 ” (通常 是 浮 点 ) 数值 。 整 数 可 用 标准 的 十 
进 制 表示 ， 或 者 通过 在 数字 之 前 添加 #fo (八进制 ) 、#x (十 六 进 制 ) 或 #5 (二 进 制 ) ， 
以 其 他 进 制 表示 。 

符号 


符号 是 一 种 字符 串 ， 但 是 不 被 引号 包围 。 有 效 的 字符 包括 字母 、 数 字 和 : 


在 使 用 read 函数 输入 时 ， 它 会 读 取 Scheme 表达 式 (也 是 解释 器 用 于 输入 程序 文本 的 东 
西 ) ， 不 区 分 符号 中 的 大 小 写 (在 STk 实现 中 会 转 为 小 写 ) 。 两 个 带 有 相同 表示 的 符号 表示 
同一 对 象 (并 不 是 两 个 碰巧 拥有 相同 内 容 的 对 象 ) 。 


偶 对 和 列表 


偶 对 是 含有 两 个 (任意 类 型 ) 成 员 的 对 象 ， 叫 做 它 的 car 和 cdr 。 car 为 A 且 cdr 为 B 的 
偶 对 可 表示 为 (A . B) 。 偶 对 (就 像 Python 中 的 元 组 ) 可 以 表示 列表 、 树 和 任意 的 层次 结 
构 。 


标准 的 Scheme 列表 包含 空 的 列表 值 〈 记 为 () ) ， 或 者 包含 一 个 偶 对 ， 它 的 car 是 列表 第 
一 个 元 素 ， cdr 是 列表 的 剩余 部 分 。 所 以 ， 和 包含 整数 1，2，3 的 列表 可 表示 为 : 


(1 . (2 . (3 . ()))) 


列表 无 处 不 在 ，Scheme 允许 我 们 将 (a . ()) 缩 略 为 (a) ， 将 (a . (b ...)) 缩 略 
为 (ab ...) 。 所 以 ， 上 面 的 列表 通常 写 为 : 


(2 


过 程 (函数 ) 


就 像 Python 中 一 样 ， 过 程 (或 函数 ) 值 表示 一 些 计算 ， 它 们 可 以 通过 向 函数 提供 参数 来 调 
用 。 过 程 要 么 是 原始 的 ， 由 Scheme 的 运行 时 系统 提供 ， 要 么 从 Scheme 表达 式 和 环境 构造 
(就 像 Python 中 那样 ) 。 没 有 用 于 子 数 值 的 直接 表示 ， 但 是 有 一 些 绑 定 到 基本 函数 的 预定 义 
标识 符 ， 也 有 一 些 Scheme 表达 式 ， 在 求 值 时 会 产生 新 的 过 程 值 。 


Scheme 也 支持 字符 和 字符 串 〈 类 似 Python 的 字符 串 ， 除 了 Scheme 区 分 字符 和 字符 串 ) ， 
以 及 向 量 (就 像 Python 的 列表 ) 。 


程序 表示 。 就 像 其 它 Lisp 版 本 ，Scheme 的 数据 值 也 用 于 表示 程序 。 例 如 ， 下 面 的 Scheme 
列表 : 


(+ x (* 10 y)) 


取决 于 如 何 使 用 ， 可 表示 为 三 个 元 素 的 列表 ( 它 的 最 后 一 个 元 素 也 是 三 个 元 素 的 列表 ) ， 或 
者 表达 为 用 于 计算 x+loy 的 Scheme 表达 式 。 为 了 将 Scheme 值 求 值 为 程序 ， 我 们 需要 考虑 
值 的 类 型 ， 并 按 以 下 步骤 求 值 : 


e。 整数 、 布 尔 值 、 字 符 、 字 符 串 和 向 量 都 求 值 为 它们 自己 。 所 以 ， 表 达 式 5 求 值 为 5。 
e 纯 符 号 看 做 变量 。 它 们 的 值 由 当前 被 求 值 环 境 来 决定 ， 就 像 Python 那样 。 
。 非 空 列表 以 两 种 方式 解释 ， 取 决 于 它们 的 第 一 个 成 员 : 
o 如 果 第 一 个 成 员 是 特殊 形式 的 符号 (在 下 面 描述 ) ， 求 值 由 这 个 特殊 形式 的 规则 执 
行 。 
o 所 有 其 他 情况 (叫做 组 合 ) 中 ， 列 表 的 成 员 会 以 非特 定 的 顺序 (递归 ) 求 值 。 第 一 
个 成 员 必 须 是 函数 值 。 这 个 值 会 被 调用 ， 以 列表 中 剩余 成 员 的 值 作 为 参数 。 
。 其 他 Scheme 值 (特别 是 ， 不 是 列表 的 偶 对 ) 在 程序 中 是 错误 的 。 


例如 : 


>>> 5 
5 

>>> (define x 3) ; A special form that creates a binding for symbol 

x 人 

>>> (+ 3 (* 10 x)) ; A combination. Symbol + is bound to the primitive 
33 ; add function and * to primitive multiply. 


; A literal. 


基本 的 特殊 形式 。 特 殊 形 式 将 东西 表示 为 Python 中 的 控制 结构 、 函 数 调用 或 者 类 的 定义 : 在 
调用 时 ， 这 些 结构 不 会 简单 地 立即 求 值 。 


首先 ， 一 些 通用 的 结构 以 这 种 形式 使 用 : 
EXPR-SEQ 


只 是 表达 式 的 序列 ， 例 如 : 
人 
当 它 出 现在 下 面 的 定义 中 时 ， 它 指 代 从 左 到 右 求 值 的 表达 式 序列 ， 序 列 中 最 后 一 个 表达 式 的 
值 就 是 它 的 值 。 
BODY 


一 些 结构 拥有 “主体 ， 它 们 是 EXPR-SEQ ， 就 像 上 面 一 样 ， 可 能 由 一 个 或 多 个 定义 处 理 。 它 们 
的 值 就 是 EXPR-SEQ 的 值 。 这 些 定义 的 解释 请 见 内 部 定义 一 节 。 


下 面 是 这 些 特殊 形式 的 代表 性 子 集 : 

定义 

定义 可 以 出 现在 程序 的 顶层 (也 就 是 不 包含 在 其 它 结构 中 ) 。 
(define SYM EXPR) 

求 出 EXPR 并 在 当前 环境 将 其 值 绑 定 到 符号 SYM 上 。 

(define (SYM ARGUMENTS) BODY) 


等 价 于 (define SYM (lambda (ARGUMENTS) BODY)) 。 


(lambda (ARGUMENTS) BODY) 


求 值 为 函数 。 ARGUMENTS 通常 为 (可 能 非 空 的 ) 不 同 符号 的 列表 ， 向 函数 提供 参数 名 称 ， 并 
且 表 明 它 们 的 数量 。 ARGUMENTS 也 可 能 具有 如 下 形式 : 


(Sym1 sym2 ... symn . symr) 


(也 就 是 说 ， 列 表 的 末尾 并 不 像 普 通 列表 那样 是 空 的 ， 最 后 的 cdr 是 个 符号 。) 这 种 情况 
下 ， symr 会 绑 定 到 列表 的 尾 后 参数 值 (后 面 的 第 n+1 个 参数 ) 。 


当 产 生 的 函数 被 调用 时 ， ARGUMENTS 在 一 个 新 的 环境 中 绑 定 到 形 参 的 值 上 ， 新 的 环境 扩展 

自 lambda 表达 式 求 值 的 环境 (就 像 Python 那样 ) 。 之 后 BoDY 会 被 求 值 ， 它 的 值 会 作为 调 
用 的 值 返 回 。 

(if COND-EXPR TRUE-EXPR OPTIONAL-FALSE-EXPR) 

求 出 coOND-EXPR ， 如 果 它 的 值 不 是 #f ， 那 么 求 出 TRUE-EXPR ， 结 果 会 作为 if 的 值 。 如 

果 COND-EXPR 值 为 #f 而 且 OPTIONAL-FALSE-EXPR 存在 ， 它 会 被 求 值 为 并 作为 if 的 值 。 如 果 
它 不 存在 ， if 值 是 未 定义 的 。 

(set! SYMBOL EXPR) 

求 出 ExPR 使 用 该 值 替换 SYMBOL 的 绑 定 。 SYMBOL 必须 已 经 绑 定 ， 否 则 会 出 现 错误 。 和 
Python 的 默认 情况 不 同 ， 它 会 在 定义 它 的 第 一 个 环境 帧 上 替换 绑 定 ， 而 不 总 是 最 深 处 的 帧 。 


(quote EXPR) 或 'EXPR 


将 Scheme 数据 结构 用 于 程序 表示 的 一 个 问题 ， 是 需要 一 种 方式 来 表示 打算 被 求 值 的 程序 广 
本 。 quote 形式 求 值 为 EXPR 自身 ， 而 不 进行 进一步 的 求 值 (替代 的 形式 使 用 前 导 的 单 引 号 ， 
由 Scheme 表达 式 读 取 器 转换 为 第 一 种 形式 ) 。 例 如 : 


>>> (+ ° 102) 

3 

>>>3 (40: 2) 
(Gr) 

>>> (define x 3) 
x 

>>> x 

3 


>>> (quote x) 
x 

>>>°5 

5 

>>> (quote 'x) 
(quote x) 


派生 的 特殊 形式 

派生 结构 时 可 以 翻译 为 基本 结构 的 结构 。 它 们 的 目的 是 让 程序 对 于 读 取 器 更 加 简洁 可 读 。 在 
Scheme 中 : 

(begin EXPR-SEQ) 

简单 地 求 值 并 产生 ExPR-sEQ 的 值 。 这 个 结构 是 个 简单 的 方式 ， 用 于 在 需要 单个 表达 式 的 上 下 
文中 执行 序列 或 表达 式 。 

(and EXPR1 EXPR2 ...) 


每 个 EXPR 从 左 到 右 执行 ， 直 到 碰 到 了 #f ， 或 遍历 完 ExPRs 。 值 是 最 后 求 值 的 EXPR ， 如 
果 ExPRs 列表 为 空 ， 那 么 值 为 #t 。 例 如 : 


>>> (and (= 2 2) (> 2 1)) 
#t 

>>> (and (< 2 2) (> 2 1)) 
#f 

>>> (and (= 2 2) '(a b)) 
(a b) 

>>> (and) 

#t 


(or EXPR1 EXPR2 ...) 


每 个 ExPR 从 左 到 右 求 值 ， 直 到 碰 到 了 不 为 #f 的 值 ， 或 遍历 完 EXPRs 。 值 为 最 后 求 值 
的 EXPR ， 如 EXPRs 列表 为 空 ， 那 么 值 为 #f 。 例 如 : 


>>> (or (= 2 2) (> 2 3)) 


#t 

>>> (or (= 2 2) '(a b)) 
#t 

>>> (or (> 2 2) '(a b)) 
(a b) 

>>> (or (> 2 2) (> 2 3)) 
#f 

>>> (or) 

#f 


(cond CLAUSE1 CLAUSE2 ...) 


每 个 cLAusEi 都 依次 处 理 ， 直 到 其 中 一 个 处 理 成 功 ， 它 的 值 就 是 cond 的 值 。 如 果 没 有 子 句 处 
理 成 功 ， 值 是 未 定义 的 。 每 个 子 句 都 有 三 种 可 能 的 形式 。 


如 果 TEST-EXPR 求 值 为 不 为 #f 的 值 ， (TEST-EXPR EXPR-SEQ) 形式 执行 成 功 。 这 种 情况 下 ， 它 
会 求 出 EXPR-SEQ 并 产生 它 的 值 。 EXPR-SEQ 可 以 不 写 ， 这 种 情况 下 值 为 TEST-EXPR 本 身 。 


最 后 一 个 子 句 可 为 (else EXPR-SEQ) 的 形式 ， 它 等 价 于 (#t EXPR-SEQ) 。 


最 后 ， 如 果 (TEST_EXPR => EXPR) 的 形式 在 TEST_EXPR 求 值 为 不 为 #f 的 值 (叫做 v ) 时 求 值 
成 功 。 如 果 求 值 成 功 ， cond 结构 的 值 是 由 (EXPR V) 返回 的 值 。 也 就 是 说 ， EXPR 必须 求 值 为 
单 参数 的 函数 ， 在 TEST_EXPR 的 值 上 调用 。 


例如 : 


>>> (cond ((> 3 2) 'greater) 
et (C32 9 les 
greater 
>>> (cond ((> 3 3) 'greater) 
((< 3 3) "less) 
(else 'equal)) 


equal 

>>> (cond ((if (< -2 -3) #f -3) => abs) 
ES (else #f)) 

3 


(case KEY-EXPR CLAUSE1 CLAUSE2 ...) 


KEY-EXPR 的 求 值 会 产生 一 个 值 K。 之 后 将 K 与 每 个 cLAusEi 一 次 匹配 ， 直 到 其 中 一 个 成 
功 ， 并 且 返 回 该 子 句 的 值 。 如 果 没 有 子 名 成功， 值 是 未 定义 的 。 每 个 子 句 都 拥 
有 ((DATUM1 DATUM2 ...) EXPR-SEQ) 的 形式 。 其 中 pATuMs 是 Scheme 值 (它们 不 会 被 求 
值 ) 。 如 果 K 匹配 了 DATUM 的 值 之 一 (由 下 面 描述 的 eqv? 函数 判断 ) ， 子 句 就 会 求 值 成 
功 ， 它 的 EXPR-SEQ 就 会 被 求 值 ， 人 case 的 值 。 最 后 的 子 名 可 
为 (else EXPR-SEQ) 的 形式 ， 它 总 是 会 成 功 ， 例 如 

>>> (case (* 2 3) 


((23 5 7) 'prime) 
((146 8 9) 'composite)) 


composite 

>>> (case (car '(a . b)) 
((ac) 'd) 

- ((b 3) 'e)) 


>>> (case (car '(c d)) 
((aeio u) 'vowel) 
((w y) 'semivowel) 
(else 'consonant)) 
consonant 


(let BINDINGS BODY) 


BINDINGS 是 偶 对 的 列表 ， 形 式 为 : 


( (VAR1 INIT1) (VAR2 INIT2) ...) 


其 中 vARs 是 (不 同 的 ) 符号 ， 而 INITs 是 表达 式 。 首 先 会 求 出 INIT 表达 式 ， 之 后 创建 新 的 
帧 ， 将 这 些 值 绑 定 到 vARs ， 再 然后 在 新 环境 中 求 出 BopYy ， 返 回 它 的 值 。 换 名 话说 ， 它 等 价 
于 调用 


((lambda (VAR1 VAR2 ...) BODY) 
INIT1 INIT2 ...) 


所 以 ， 任 何 INIT 表达 式 中 的 vARs 引用 都 指向 这 些 符号 在 let 结构 外 的 定义 (如果 存在 的 
话 ) ， 例 如 : 


>>> (let ((x 2) (y 3)) 
(* x y)) 
6 
>>> (let ((x 2) (y 3)) 
i (let ((x 7) (z (+ x y))) 
ee 2 
35 


(let* BINDINGS BODY) 


BINDINGS 的 语法 和 let 相同 。 它 等 价 于 


(let ((VAR1 INIT1) ) 


(let ((VARn INITn)) 
BODY) ) 


也 就 是 说 ， 它 就 像 let 表达 式 那 样 ， 除 了 vAR1 的 新 绑 定 对 INITs 子 序 列 以 及 BopY 中 可 
见 ， VAR2 与 之 类 似 ， 例 如 : 


>>> (define x 3) 
X 
>>> (define y 4) 


y 
0 (let ((x 5) (y (+ x 1))) y) 


>>> (let* ((x 5) (y (+ x 1))) y) 
6 


(letrec BINDINGS BODY) 


同样 ， 语 法 类 似 于 let 。 这 里 ， 首 先 会 创 ( 带 有 未 定义 的 值 ) ， 之 后 INITs 被 求 
值 并 赋 给 它们 。 如 果 某 个 INITs 使 用 了 某 个 vAR 的 值 ， 并 且 没 有 为 其 赋 初 始 值 ， 结 果 是 未 定 
义 的 。 这 个 形式 主要 用 于 定义 互相 递归 的 i (lambda 本 身 并 不 会 使 用 它们 提 到 过 的 值 ; 这 
只 会 在 它们 被 调用 时 随后 发 生 ) 。 例 如 : 


(letrec ((even? 
(lambda (n) 
(if (zero? n) 
#t 
(odd? (- n 1))))) 
(odd? 
(lambda (n) 
(if (zero? n) 
#f 
(even? (- n 1)))))) 
(even? 88)) 


内 部 定义 。 当 BopY 以 define 结构 的 序列 开始 时 ， 它 们 被 看 作 “ 内 部 定义 "”， 并 且 在 解释 上 与 
顶层 定义 有 些 不 同 。 特 别 是 ， 它 们 就 像 letrec 那样 。 


e@ 首先 ， 会 为 所 有 由 define 语句 定义 的 名 称 创建 绑 定 ， 一 开始 绑 定 到 未 定义 的 值 上 。 
e@ 之 后 ， 值 由 定义 来 填充 。 


所 以 ， 内 部 函数 定义 的 序列 是 互相 递归 的 ， 就 像 Python 中 风 套 在 函数 中 的 def* 语 名 那样 : 


>>> (define (hard-even? x) 5 
a (define (even? n) 

(if (zero? n) 
#t 
(odd? (- 
(odd? n) 
(zero? n) 
#f 
(even? (- 

(even? x)) 

>>> (hard-even? 22) 
#t 


x 


n 1)))) 


Wak 


(define 
(if 


n 1)))) 


; An outer-level definition 
Inner definition 


Inner definition 


预定 义 函 数 。 预 定义 函数 有 很 多 ， 都 在 全 局 环境 中 绑 定 到 名 称 上 ， 我 们 只 会 展示 一 小 部 分 


其 余 的 会 在 Revised(4) Scheme 报告 中 列 出 
递归 求 出 所 有 项 目 ( 


同 的 完全 统一 的 求 值 规则 : 北 
用 运算 符 的 值 ( 它 必须 是 个 函数 ) 


0° 


e@ 算数 : Scheme 提供 了 标准 的 算数 运 
在 操作 数 前 面 : 


>>>0 
>>> ; Compute (3+7+10)*(1000-8) // 992 - 
>>> (- (quotient (* (+ 3 7 10) (- 

3 

>>> (remainder 27 4) 

3 

>>> (- 17) 

-17 


与 之 相似 ， 存 在 通用 的 数学 比较 运算 
>>> (< 0 5) 
#t 
>>> (>= 100 10 10 0) 
#t 
>>=°%(=° 20( 7 3) (2). 
#t 
>>> (not (= 15 14)) 
#t 
>>> (zero? (- 7 7)) 
#t 


随便 提 一 下 ， not 是 个 函数 ， 并 不 是 and 或 or 的 特殊 形式 ， 因 为 他 的 运 


值 ， 所 以 不 需要 特殊 对 待 。 


e 列表 和 偶 对 。 很 多 操作 用 于 处 理 偶 对 和 列表 【它们 同样 由 偶 对 和 空 


云 A 大 大 


运算 符 


对 符 ， 


。 雹 数 调用 并 不 是 “特殊 的 "， 因 为 它们 都 使 用 相 
， 并且 之 后 在 操作 数 的 值 上 调 


汉 管 


包括 运算 符 ) 


， 许多 都 拥有 熟悉 的 表示 ， 虽 然 它 们 统一 出 现 


; Semicolons introduce one-line comments. 


17 
1000 8))) 17) 


为 可 接受 多 于 两 个 参数 而 扩展 : 


云 A 大 大 


云 算 符 必须 求 


0° 


列表 构建 ) 


>>> (cons 'a 'b) 
(a . b) 
>>> (list 'a 'b) 
(a b) 
>>> (cons 'a (cons 'b '())) 
(a b) 
>>> (car (cons 'a 'b)) 
a 
>>> (cdr (cons 'a 'b)) 
b 
>>> (cdr (list a b)) 
b 
> (cadr '(a b)) ; An abbreviation for (car (cdr '(a b))) 
b 
>>> (cddr '(a b)) ; Similarly, an abbreviation for (cdr (cdr '(a b))) 
() 
>>> (list-tail '(a b c) 0) 
(a bc) 
>>> (list-tail '(a b c) 1) 
(b c) 
>>> (list-ref '(a b c) 0) 
a 
>>> (list-ref '(a b c) 2) 
CE 
>>> (append '(a b) '(c d) '() '(e)) 
(abcd  e) 
>>> ; All but the last list is copied. The last is shared, so: 
>>> (define L1 (list 'a 'b 'c)) 
>>> (define L2 (list 'd)) 
>>> (define L3 (append L1 L2)) 
>>> (set-car! L1 1) 
>>> (set-car! L2 2) 
>>> L3 
(a bc 2) 
>>> (null? '()) 
#t 
> 有人 so 人 让 
#t 
>>> (list? '(a b)) 
#t 
>>>° (Clist2 (a hb) 
#f 


。 相等 性 : = 运算 符 用 于 数值 。 通 常 对 于 值 的 相等 性 ，Scheme 区 分 eq? (就 像 Python 
的 is ) ， eqv? (与 之 类 似 ， 但 是 和 数值 上 的 = 一 样 ) ， 和 equal? (比较 列表 结构 或 
字符 串 的 内 容 ) 。 通 常 来 说 ， 除 了 在 比较 符号 、 布 尔 值 或 者 空 列 表 的 情况 中 ， 我 们 都 使 
用 eqv? 和 equal? ° 


>>> (eqv? 'a 'a) 

>>> (eqv? 'a 'b) 

>>> (eqv? 100 (+ 50 50)) 

>>> (eqv? (list 'a 'b) (list 'a 'b)) 


>>> (equal? (list 'a 'b) (list 'a 'b)) 


e 类 型 。 每 个 值 的 类 型 都 只 满足 一 个 基本 的 类 型 断言 。 


>>> (boolean? #f) 
>>> (integer? 3) 
>>> (pair? '(a b)) 
>>> (null? '()) 
>>> (symbol? 'a) 


>>> (procedure? +) 


。 输入 和 输出 : Scheme 解释 器 通 
买 


常 执行 " 读 取 - 求 值 -打印 "循环 ， 但 是 我 们 可 以 在 程序 控制 
下 显 式 输出 东西 ， 使 用 与 解释 器 内 


部 相同 的 函数 : 


>>> (begin (display 'a) (display 'b) (newline)) 
ab 


于 是 ， (display x) 与 Python 的 


print(str(x), end="") 


相似 ， 并 且 (newline) 类 似 于 print() 。 


对 于 输入 来 说 ， (read) 从 当前 “端口 " 读 取 Scheme 表达 式 。 它 并 不 会 解释 表达 式 ， 而 是 
将 其 读 作 数 据 : 


>>> (read ) 
>>> (a b c) 
(a bc) 


e。 求 值 。 apply 函数 提供 了 函数 调用 运算 的 直接 访问 : 


>>> (apply cons '(1 2)) 
(C2 

>>> ;; Apply the function f to the arguments in L after g is 
>>> ;; applied to each of them 

>>> (define (compose-list f g L) 

+ (apply f (map g L))) 

>>> (compose-list + (lambda (x) (* x x)) '(1 2 3)) 

14 


这 个 扩展 允许 开头 出 现 “ 固 定 " 参 数 : 


>>> (apply + 1 2 '(3 4 5)) 
15 


下 面 的 函数 并 不 在 Revised(4) Scheme 中 ， 但 是 存在 于 我 们 的 解释 器 版 本 中 (警告 : 非 
标准 的 过 程 在 Scheme 的 后 续 版 本 中 并 不 以 这 种 形式 定义 ) 


>>> (eval '(+ 1 2)) 
3 


也 就 是 说 ，eval 求解 一 块 Scheme 数据 ， 它 表示 正确 的 Scheme 表达 式 。 这 个 版 本 在 
全 局 环境 中 求解 表达 式 的 和 参数。 我 们 的 解释 器 也 提供 了 一 种 方式 ， 来 规定 求 值 的 特定 环 


境 


>>> (define (incr n) (lambda (x) (+ n x))) 
>>> (define add5 (incr 5)) 
>>> (add5 13) 


>>> (eval 'n (procedure-environment add5) ) 


3.6.2 Logo 语言 


Logo 是 Lisp 的 另 一 种 方言 。 它 为 教育 用 途 而 设计 ， 所 以 Logo 的 许多 设计 决策 是 为 了 让 语言 
对 新 手 更 加 友好 。 例 如 ， 多 数 Logo 过 程 以 前 级 形式 调用 (首先 是 过 程 名 称 ， 其 次 是 参数 ) ， 
但 是 通用 的 算术 运算 符 以 普遍 的 中 级 形式 提供 。Logo 的 伟大 之 处 是 ， 它 的 简单 亲切 的 语法 仍 
旧 为 高 级 程序 员 提 供 了 惊人 的 表现 力 。 


Logo 的 核心 概念 是 ， 它 的 内 建 容器 类 型 ， 也 就 是 Logo sentence (也 叫 作 列表 ) 2 可 以 轻易 
储存 Logo 源码 ， 这 也 是 它 的 强大 表现 力 的 来 源 。Logo 的 程序 可 以 编写 和 执行 Logo 表达 

式 ， 作 为 求 值 过 程 的 一 部 分 。 许 多 动态 语言 都 支持 代码 生成 ， 包 括 Python， 但 是 没有 语言 像 
Logo 一 样 使 代码 生成 如 此 有 趣 和 易 用 。 


你 可 能 希望 下 载 完 整 的 Logo 解释 器 来 体验 这 个 语言 。 标 准 的 实现 是 Berkeley Logo (也 叫做 
UCBLogo) ， 由 Brian Harvey 和 他 的 Berkeley 学 生 开 发 。 对 于 苹果 用 户 ，ACSLogo 兼容 
Mac OSX 的 最 新 版 本 ， 并 带 有 一 份 介绍 Logo 语言 许多 特性 的 用 户 指南 。 


基础 。Logo 设计 为 会 话 式 。 它 的 读 取 - 求 值 循环 的 提示 符 是 一 个 问号 ( ? ) ， 产 生 了 "我 下 面 
应 该 做 什么 ? "的 问题 。 我 们 自然 想 让 它 打印 数值 : 


? print 5 
5 


Logo 语言 使 用 了 非 标准 的 调用 表达 式 语法 ， 完 全 不 带 括号 分 隔 符 。 上 面 ， 参 数 5 转 给 
了 print ， 它 打印 了 它 的 参数 。 描 述 Logo 程序 结构 的 术语 有 些 不 同 于 Python。Logo 拥有 过 
程 而 不 是 Python 中 等 价 的 函数 ， 而 且 过 程 输出 值 而 不 是 返回 值 。 和 python 类似，print 过 
程 总 是 输出 None ， 但 也 打印 出 参数 的 字符 串 表 示 作 为 副作用 。 (过 程 的 参数 在 Logo 中 也 通 
常 叫做 输入 ， 但 是 为 了 清晰 起 见 ， 这 篇 文章 中 我 们 仍然 称 之 为 参数 。) 


Logo 中 最 常见 的 数据 类 型 是 单词 ， 它 是 不 带 空 格 的 字符 串 。 单 词 用 作 可 以 表示 数值 、 名 称 和 
布尔 值 的 通用 值 。 可 以 解释 为 数值 或 布尔 值 的 记号 ， 比 如 5 ， 直 接 来 值 为 单词 。 另 一 方面 ， 
类 似 five 的 名 称 解 释 为 过 程 调用 : 


也 5 

You do not say what to do with 5. 
? five 

I do not know how to five. 


5 和 five 以 不 同方 式 解释 ，Logo 的 读 取 - 求 值 循环 也 以 不 同方 式 报错 。 第 一 种 情况 的 问题 
是 ，Logo 在 顶层 表达 式 不 求 值 为 None 时 报错 。 这 里 ， 我 们 看 到 了 第 一 个 Logo 不 同 于 计算 
器 的 结构 ; 前 者 的 接口 是 读 取 - 解 释 循环 ， 期 待 用 户 来 打印 结果 。 后 者 使 用 更 加 通用 的 读 取 - 求 
值 -打印 循环 ， 自 动 打 印 出 返回 值 。Python 采取 了 混合 的 方式 ， 非 None 的 值 使 用 repr 强制 
转换 为 字符 串 并 自动 打印 。 


Logo 的 行 可 以 顺序 包含 多 个 表达 式 。 解 释 器 会 一 次 求 出 每 个 表达 式 。 如 果 行 中 任何 顶层 表达 
式 不 求 值 为 None ， 解 释 器 会 报错 。 一 旦 发 生 错 误 ， 行 中 其 余 的 表达 式 会 被 忽略 。 


? print 1 print 2 
AL 
2 


? 3 print 4 
You do not say what to do with 3. 


Logo 的 调用 表达 式 可 以 谋 套 。 在 Logo 的 实现 版 本 中 ， 每 个 过 程 接受 固定 数量 的 参数 。 所 
以 ， 当 上 殴 套 调用 表达 式 的 操作 数 完整 时 ，Logo 解释 器 能 够 唯一 地 判断 。 例 如 ， 考 虑 两 个 过 
程 sum 和 difference ， 它 们 相应 输出 两 个 参数 的 和 或 差 。 


? print sum 10 difference 7 3 
14 


我 们 可 以 从 这 个 虞 套 的 例子 中 看 到 ， 分 隔 调 用 表达 式 的 圆 括号 和 和 运 号 不 是 必须 的 。 在 计算 器 
解释 器 中 ， 标 点 符号 允许 我 们 将 表达 式 树 构建 为 纯粹 的 句法 操作 ， 没 有 任何 运算 符 名 称 的 判 
断 。 在 Logo 中 ， 我 们 必须 使 用 我 们 的 知识 ， 关 于 每 个 过 程 接受 多 少 参 数 ， 来 得 出 谨 套 表达 式 
的 正确 结构 。 下 一 节 中 ， 问 题 的 细节 会 深入 探讨 。 


Logo 也 支持 中 组 运算 符 ， 例 如 + 和 * “。 这 些 运算 符 的 优先 级 根据 代数 的 标准 规则 来 解析 。 
乘法 和 除法 优 于 加 法 和 减法 : 


DD dt 
14 


如 何 实 现 运算 符 优先 级 和 前 组 运算 符 来 生成 正确 的 表达 式 树 的 细节 留 做 练习 。 对 于 下 面 的 讨 
论 ， 我 们 会 专注 于 使 用 前 级 语法 的 调用 表达 式 。 


引用 。 一 个 名 称 会 被 解释 为 调用 表达 式 的 开始 部 分 ， 但 是 我 们 也 希望 将 单词 引用 为 数据 。 以 
双 引 号 开始 的 记号 解释 为 单词 字面 值 。 要 注意 单词 字面 值 在 Logo 中 并 没有 尾 后 的 双 引 号 。 


? print "hello 
hello 


在 Lisp 的 方言 中 (而 Logo 是 它 的 方言 ) ， 任 何不 被 求 值 的 表达 式 都 叫做 引用 。 这 个 引用 的 
概念 来 自 于 事物 之 间 的 经 典 哲 学 。 例 如 一 只 狗 ， 它 可 以 到 处 乱 跑 和 叫唤 ， 而 单词 “ 狗 " 只 是 用 于 
指 代 这 种 事物 的 语言 结构 。 当 我 们 以 引号 使 用 " 狗 ? 的 时 候 ， 我 们 并 不 是 指 特定 的 哪 一 只 ， 而 是 
这 个 单词 。 在 语言 中 ， 引 号 允许 我 们 谈论 语言 自身 ，Logo 中 也 一 样 。 我 们 可 以 按照 名 称 引 

用 sum 过 程 ， 而 不 会 实际 调用 它 ， 通 过 这 样 引 用 它 : 


? print "sum 
sum 


除了 单词 ，Logo 包含 句子 类 型 ， 可 以 叫做 列表 。 和 句子 由 方 括号 包围 。 print 过 程 并 不 会 打印 
方 括号 ， 以 维持 Logo 的 惯例 风格 ， 但 是 方 括号 可 以 使 用 show 过 程 打印 到 输出 : 


? print [hello world] 
hello world 

? show [hello world] 
[hello world] 


句子 也 可 以 使 用 三 个 不 同 的 二 元 过 程 来 构造 。 sentence 过 程 将 参数 组 装 为 句子 。 它 是 多 态 过 
程 ， 如 果 参 数 是 单词 ， 会 将 它 的 参数 放 入 新 的 句子 中 ; 如 果 参 数 是 甸子 ， 则 会 将 拼接 参数 。 
结果 通常 是 一 个 句子 : 


? show sentence 1 2 

[1 2] 

? show sentence 1 [2 3] 
[1 2 3] 

? show sentence [1 2] 3 
[1 2 3] 

? show sentence [1 2] [3 4] 
2534 


list 过 程 从 两 个 元 素 创建 句子 ， 它 允许 用 户 创建 层次 数据 结构 : 


? show list 1 2 

[1 2] 

? show list 1 [2 3] 

[1 [2 3]] 

? show list [1 2] 3 

[[1 2] 3] 

? Show list [1 2] [3 4] 
[[1 2] [3 4]] 


最 后 ， fput 过 程 从 第 一 个 元 素 和 列表 的 剩余 部 分 创建 列表 ， 就 像 这 一 章 之 前 的 Python 
RList 构造 器 那样 : 


? show fput 1 [2 3] 
[E231 

? Show fput [1 2] [3 4] 
E23 


我 们 在 Logo 中 可 以 调用 sentence 、 list 和 fput 句子 构造 器 。 在 Logo 中 将 句子 解构 
为 first 和 剩余 部 分 (叫做 putfirst ) 也 非常 直接 ， 所 以 ， a 系列 句子 的 选择 器 
过 程 。 


print first [1 2 3] 
print last [1 2 3] 


print butfirst [1 2 3] 
2 3] 


作为 数据 的 表达 式 。 和 句子 的 内 容 可 以 直接 当做 未 求 值 的 引用 。 所 以 ， 我 们 可 以 打印 出 Logo 表 
达 式 而 不 求 值 : 


? show [print sum 1 2] 
[print sum 1 2] 


将 Logo 表示 表达 式 表示 为 银子 的 目的 通常 不 是 打印 它们 ， 而 是 使 用 run 过 程 来 求 值 。 


? run [print sum 1 2] 
3 


通过 组 合 引 用 和 句子 构造 器 ， 以 及 run 过 程 ， 我 们 获得 了 一 个 非常 通用 的 组 合 手段 ， 它 赁 空 
构建 Logo 表达 式 并 对 其 求 值 : 


? run sentence "print [sum 1 2] 
3 


? print run sentence "sum sentence 10 run [difference 7 3] 
14 


后 一 个 例子 的 要 点 是 为 了 展示 ， 虽 然 sum 和 difference 过 程 在 Logo 中 并 不 是 一 等 的 构造 
器 (它们 不 能 直接 放 在 句子 中 ) ， 它 们 的 名 称 是 一 等 的 ， 并 且 run 过 程 可 以 将 它们 的 名 称 解 
析 为 所 引用 的 过 程 。 


将 代码 表示 为 数据 ， 并 且 稍 后 将 其 解释 为 程序 的 一 部 分 的 功能 ， 是 Lisp 风格 语言 的 特性 。 程 
序 可 以 重新 编写 自己 来 执行 是 一 个 强大 的 概念 ， 并 且 作 为 人 工 智能 (Al) 早期 研究 的 基础 。 
Lisp 在 数 十 年 间 都 是 Al 研究 者 的 首选 语言 。Lisp 语言 由 John McCarthy 发 明 ， 他 也 发 明 

了 “人 工 智能 "术语 ， 并 且 在 该 领域 的 定义 中 起 到 关键 作用 。Lisp 方言 的 “代码 即 数 据 ” 的 特性 ， 
以 及 它们 的 简洁 和 优雅 ， 今 天 仍 继续 吸引 着 Lisp 程序 员 。 


海龟 制图 (Turtle graphics) 。 所 有 Logo 的 实现 都 基于 Logo 海龟 来 完成 图 形 输出 。 这 个 
海龟 以 画布 的 中 点 开始 ， 基 于 过 程 移动 和 转向 ， 并 且 在 它 的 轨迹 上 画 线 。 虽 然 海鱼 为 鼓励 青 
少年 实践 编程 而 发 明 ， 它 对 于 高 级 程序 员 来 说 也 是 有 趣 的 图 形 化 工具 。 


在 执行 Logo 程序 的 任意 时 段 ，Logo 海龟 都 在 画布 上 拥有 位 置 和 朝向 。 类 似 

于 forward 和 right 的 一 元 过 程 能 修改 海龟 的 位 置 和 朝向 。 常 用 的 过 程 都 有 缩 

写 : forward 也 叫 作 fd ， 以 及 其 它 。 下 面 的 谋 套 表达 式 画 出 了 每 个 端点 带 有 小 星星 的 大 星 
星 : 


? repeat 5 [fd 100 repeat 5 [fd 20 rt 144] rt 144] 


N 


海龟 过 程 的 全 部 指令 也 内 建 于 Python 的 turtle 模块 中 。 这 些 函 数 的 有 限 子 集 也 在 这 一 章 的 
配套 项 目 中 提供 。 


赋值 。Logo 支持 绑 定名 称 和 值 。 就 像 Python 中 那样 ，Logo 环境 由 帧 的 序列 组 成 ， 每 个 帧 中 
的 某 个 名 称 都 最 多 绑 定 到 一 个 值 上 。 名 称 使 用 make 过 程 来 绑 定 ， 它 接受 名 称 和 值 作为 参数 。 


2 make "x 2 


任何 以 冒号 起 始 的 单词 ， 例 如 :x 都 叫做 变量 。 变 量 求 值 为 其 名 称 在 当前 环境 中 绑 定 的 值 。 


make 过 程 和 Python 的 赋值 语句 具有 不 同 的 作用 。 传 递 给 make 的 名 称 要 么 已 经 绑 定 了 值 ， 
要 么 当前 未 绑 定 。 


1， 如果 名 称 已 经 绑 定 ， make 在 找到 它 的 第 一 帧 中 重新 绑 定 该 名 称 。 
2. 如 果 没 有 绑 定 ” make 在 全 局 帧 中 绑 定 名 称 9 


这 个 行为 与 Python 赋值 语句 的 语义 很 不 同 ， 后 者 总 是 在 当前 环境 中 的 第 一 帧 中 绑 定名 称 。 上 
面 的 第 一 条 规则 类 似 于 遵循 nonlocal 语句 的 Python 赋值 。 第 二 条 类 似 于 遵循 global 语句 的 
全 局 赋值 。 


过 程 。Logo 支持 用 户 使 用 以 to 关键 字 开 始 的 定义 来 定义 过 程 。 定 义 是 Logo 中 的 最 后 一 个 
表达 式 类 型 ， 在 调用 表达 式 、 基 本 表达 式 和 引用 表达 式 之 后 。 定 义 的 第 一 行 提供 了 新 过 程 的 
名 称 ， 随 后 是 作为 变量 的 形 参 。 下 面 的 行 是 过 程 的 主体 ， 它 可 以 跨越 多 行 ， 并 且 必 须 以 只 包 
人 钨 end 记号 的 一 行 结束 。Logo 的 读 取 - 求 值 循环 使 用 > 连接 符 来 提示 用 户 输入 过 程 体 。 用 户 
定义 过 程 使 用 output 过 程 来 输出 一 个 值 。 


? to double :x 

> output sum :x :x 
> end 

? print double 4 

8 


Logo 的 用 户 定义 过 程 所 产生 的 调用 过 程 和 Python 中 的 过 程 类 似 。 在 一 系列 参数 上 调用 过 程 
以 使 用 新 的 帧 扩展 当前 环境 ， 以 及 将 过 程 的 形 参 绑 定 到 实 参 开始 ， 之 后 在 开始 于 新 帧 的 环境 
中 求 出 过 程 体 的 代码 行 。 


output 的 调用 在 Logo 中 与 Python 中 的 return 语句 有 相同 作用 : 它 会 中 止 过 程 体 的 执行 ， 
并 返回 一 个 值 。Logo 过 程 可 以 通过 调用 stop 来 不 带 任何 值 返 回 。 


to count 
print 1 
print 2 
stop 
print 3 
end 
count 


DPIVVVVVY 


作用 域 。Logo 是 动态 作用 域 语言 。 类 似 Python 的 词法 作用 域 语言 并 不 允许 一 个 函数 的 局 部 
名 称 影响 另 一 个 函数 的 求 值 ， 除非 第 二 个 函数 显 式 定义 在 第 一 个 函数 内 。 两 个 顶层 函数 的 形 
参 完全 是 隔离 的 。 在 动态 作用 域 的 语言 中 ， 没 有 这 种 隔离 。 当 一 个 函数 调用 另 一 个 函数 时 ， 
绑 定 到 第 一 个 函数 局 部 帧 的 名 称 可 在 第 二 个 函数 的 函数 体 中 访问 : 


to print_last_x 
print :x 

end 

to print x :x 
print_last_ x 
end 

print x 5 


WS 


虽然 名 称 x 并 没有 在 全 局 帧 中 绑 定 ， 而 是 在 print_x 的 局 部 帧 中 ， 也 就 是 首先 调用 的 函数 。 
Logo 的 动态 作用 域 规则 允许 函数 print_last_x 引用 x ， 它 被 绑 定 到 print_x 的 形式 参数 
下 


动态 作用 域 只 需要 一 个 对 计算 环境 模型 的 简单 修改 就 能 实现 。 由 用 户 函 数 调 用 创建 的 帧 总 是 
扩展 自 当 前 环境 (调用 处 ) 。 例 如 ， 上 面 的 print_x 调用 引入 了 新 的 帧 ， 它 扩展 自 当 前 环 
境 ， 当 前 环境 中 包含 print_x 的 局 部 帧 和 全 局 帧 。 所 以 ， 在 print_last_x 的 主体 中 查找 x 会 
发 现 局 部 帧 中 该 名 称 绑 定 到 5 。 与 之 相似 ， 在 Python 的 词法 作用 域 下 ， print_last_x 的 帧 
只 扩展 自 全 局 帧 (定义 处 ) ， 而 并 不 扩展 自 print x 的 局 部 帧 【调用 处 ) 。 


动 态 作 用 域 语 言 拥有 一 些 好 处 ， 它 的 过 程 可 能 不 需要 接受 许多 参数 。 例 如 ， print_last_x 
面 的 过 程 没有 接受 参数 ， 但 是 它 的 行为 仍然 由 内 层 作用 域 参数 化 。 


常规 编程 。 我 们 的 Logo 之 旅 就 到 此 为 止 了 。 我 们 还 没有 介绍 任何 高 级 特性 ， 例 如 ， 对 象 系 
统 、 高 阶 过 程 ， 或 者 语句 。 学 会 在 Logo 中 高 效 编程 需要 将 语言 的 简单 特性 组 合 为 有 效 的 整 
体 。 


Logo 中 没有 条 件 表 达 式 类 型 。 过 程 if 和 ifelse 使 用 调用 表达 式 的 求 值 规则 。 if 的 第 一 个 
参数 是 不 布尔 单词 ， 国 加 四 式 者 ga ， 二 个 参数 不 是 输出 值 ， 而 是 一 个 句子 ， 包 含 如 果 第 
一 个 参数 为 True 时 需要 求 值 的 代码 行 。 这 个 设计 的 重要 结果 是 ， 第 二 个 函数 的 内 容 如 果 不 被 
用 到 就 不 会 全 部 求 值 。 


? 1/0 
div raised a ZeroDivisionError: division by zero 
? to reciprocal :x 


> if not :x = © [output 1 / :x] 
> output "infinity 

> end 

? print reciprocal 2 

0.5 

? print reciprocal 0 

infinity 


Logo 的 条 件 语 名 不 仅仅 不 需要 特殊 语法 ， 而 且 它 实际 上 可 以 使 用 word 和 run 实 

现 。 ifelse 的 基本 过 程 接受 三 个 函数 : 布尔 单词 、 如 果 单 词 为 True 需要 求 值 的 句子 ， 和 如 
果 单 词 为 False 需要 求 值 的 句子 。 通 过 适当 命名 形式 和 参数， 我 们 可 以 实现 拥有 相同 行为 的 用 
户 定义 过 程 ifelse2 。 


? to ifelse2 :predicate :True :False 


> output run run word ": :predicate 

> end 

? print ifelse2 emptyp [] ["empty] ["full] 
empty 


递归 过 程 不 需要 任何 特殊 语法 ， 它 们 可 以 和 run 、 sentence 、 first 和 butfirst 一 起 使 
用 ， 来 定义 句子 上 的 通用 序列 操作 。 例 如 ， 我 们 可 以 通过 构建 二 元 句子 并 执行 它 ， 来 在 参数 
上 调用 过 程 。 如 果 参 数 是 个 单词 ， 它 必须 被 引用 。 


? to apply_fn :fn :arg 
> output run list :fn ifelse word? :arg [word "" :arg] [:arg] 
> end 


下 面 ， 我 们 可 以 定义 一 个 过 程 ， 它 在 句子 :s 上 乏 步 映射 函数 :fn 。 


? to map_fn :fn :S 

> if emptyp :s [output [1]] 

> output fput apply_fn :fn first :s map_fn :fn butfirst :S 
> end 

? show map "double [1 2 3] 

[2 4 6] 


map_fn 主体 的 第 二 行 也 可 以 使 用 圆 括 号 编写 ， 表 明 调 用 表达 式 的 府 套 结构 。 但 是 ， 圆 括号 表 
示 了 调用 表达 式 的 开始 和 末尾 ， 而 不 是 包围 在 操作 数 和 非 运 算 符 周围 。 


> (output (fput (apply_fn :fn (first :s)) (map_fn :fn (butfirst :S)))) 


圆 括号 在 Logo 中 并 不 必须 ， 但 是 它们 通常 帮助 程序 员 记 录 嵌 套 表 达 式 的 结构 。 许 多 Lisp 的 
方言 都 需要 圆 括 号 ， 所 以 就 拥有 了 显 式 谋 套 的 语法 。 


作为 最 后 一 个 例子 ， -0 可 以 以 非常 紧凑 的 形式 使 用 海龟 制图 来 递归 作 图 。 谢 7 斯 基 三 角 
是 个 分 形 图 形 ， 它 绘 第 三 角形 的 同时 还 绘制 邻近 的 三 个 三 角形 ， 它 们 的 顶点 是 包含 它们 
2 度 来 绘制 。 


? to triangle :exp 
> repeat 3 [run :exp lt 120] 
> end 


? to sierpinski :d :Kk 
> triangle [ifelse :k = 1 [fd :d] [leg :d :k]] 


> end 

? to leg :d :Kk 

> SLNDanskKi :dd/ 2 
> penup fd :d pendown 

> end 


triangle 过 程 是 个 通用 方法 ， 它 重复 三 次 绘制 过 程 ， 并 在 每 个 重复 之 后 左 转 。 sierpinski 过 
程 接受 长 度 和 递归 深度 。 如 果 深 度 为 1 ， 它 画 出 纯 三 角形 ， 否 则 它 画 出 由 1og 的 调用 所 组 成 
的 三 角形 。 leg 过 程 画 出 谢 尔 宾 斯 基 递 归 三 角 型 的 一 条 边 ， 通 过 递归 调用 sierpinski 填充 这 
条 边 长 度 的 上 一 半 ， 之 后 将 海龟 移动 到 另 一 个 顶点 上 。 过 程 up 和 down 通过 将 笔 拿 起 并 在 之 
后 放下 ， 在 海龟 移动 过 程 中 停止 画图 。 sierpinski 和 leg 之 间 的 多 重 递归 产生 了 如 下 结果 : 


? sierpinski 400 6 





从 从 人 众人 人 众人 众人 众人 众人 


3.6.3 结构 


这 一 节 描 述 了 Logo 解释 器 的 通常 结构 。 虽 然 这 一 章 是 独立 的 ， 它 也 确实 引用 了 配套 项 目 。 完 
成 这 个 项 目 会 从 零 制 造 出 这 一 章 描述 的 解释 器 的 有 效 实现 。 


Logo 的 解释 器 可 以 拥有 和 计算 器 解释 器 相同 的 结构 。 解 析 器 产生 表达 式 数据 结构 ， 它 们 可 由 
求 值 器 来 解释 。 求 值 函 数 检查 表达 式 的 形式 ， 并 且 对 于 调用 表达 式 ， 它 在 一 些 参数 上 调用 函 
数 来 应 用 某 个 过 程 。 但 是 ， 还 是 存在 一 些 结构 上 的 不 同 以 适应 Logo 的 特殊 语法 。 

行 。Logo 解析 器 并 不 读 取 一 行 代 码 ， 而 是 读 取 可 能 按 序 包 含 多 个 表达 式 的 整 行 代码 。 它 不 返 
回 表达 式 树 ， 而 是 返回 Logo 句子 。 

解析 器 实际 上 只 做 微小 的 语法 分 析 。 特 别 是 ， 解 析 工 作 并 不 会 将 调用 表达 式 的 运算 符 和 操作 
数 子 表达 式 区 分 为 树 的 不 同 枝 干 。 反 之 ， 调 用 表达 式 的 组 成 部 分 顺序 排列 ， 许 套 调用 表达 式 
表示 为 挫 平 的 记号 序列 。 最 终 ， 解 析 工 作 并 不 判断 基本 表达 式 ， 例 如 数值 的 类 型 ， 因 为 Logo 
没有 丰富 的 类 型 系统 。 反 之 ， 每 个 元 素 都 是 单词 或 句子 。 


>>>°"parsendine( prant sum Lodrffierence®7 3s) 
[ernte ee Sum lO nttierence So 


解析 器 做 了 很 微小 的 分 析 ， 因 为 Logo 的 动态 特性 需要 求 值 器 解析 点 套 表达 式 的 结构 。 


解析 器 并 不 会 弄 清 句 子 的 谋 套 结构 ， 句 子 中 的 句子 表示 为 Python 的 诅 套 列表 。 


>>>>panrsealane( print sentence® thasa irsra ldeepll list 
Sprint Sentencer a thause ls a leen a lystalyd 


parse_line 的 完整 实现 在 配套 项 目的 Jogo_parser.py 中 8 


求 值 。Logo 一 次 求 值 一 行 。 求 值 器 的 一 个 框架 实现 定义 在 配套 项 目的 logo.py 中 。 

从 parse_line 返回 的 句子 传 给 了 eval line 函数 ， 它 求 出 行 中 的 每 个 表达 式 。 eval line 区 
数 重 复 调 用 logo_eval ， 它 求 出 行 中 的 下 一 个 完整 的 表达 式 ， 直 到 这 一 行 全 部 求 值 完毕 ， 之 
后 返回 最 后 一 个 值 。 logo_eval 函数 求 出 单个 表达 式 。 





f 、 


Evaluate a line | eval_line | Return the last value 


J 


Evaluate the 机 logo_eval | Return its value 


next expression 


A 





1ogo_eval 哆 数 求 出 不 同形 式 的 表达 式 : 基本 、 变 量 、 定 义 、 引 用 和 调用 表达 式 ， 我 们 已 经 
在 上 一 节 中 介绍 过 它们 了 。Logo 中 多 元 素 表达 式 的 形式 可 以 由 检查 第 一 个 元 素来 判断 。 表 达 
式 的 每 个 形式 都 有 自己 的 求 值 规则 。 


1. 基本 表达 式 〈 可 以 解释 为 数值 、 True 或 False 的 单词 ) 求 值 为 自身 。 


2.， 变量 在 环境 中 查找 。 环 境 会 在 下 一 节 中 详细 讨论 。 

人 

4. 引用 表达 式 求 值 为 引用 的 文本 ， 它 是 个 去 掉 前 导 引 号 的 字符 串 。 句 子 〈《 表 示 为 Python 列 
表 ) 也 看 做 引用 ， 它 们 求 值 为 自身 。 

5. 调用 表达 式 在 当前 环境 中 查找 运算 符 名 称 ， 并 且 调 用 绑 定 到 该 名 称 的 过 程 。 


下 面 是 1ogo_apply 的 简单 实现 。 我 们 去 掉 了 一 些 错误 检查 ， 以 专注 于 我 们 的 讨论 。 配 套 项 目 
中 有 更 加 健壮 的 实现 。 


>>>>def Logo PeVal(line, env): 
“Evaluyuatenthe farsteexpressuon Ln an nen 
token = line.pop() 
If isprimitive(token): 
return token 
elif Isvariable(token) : 
return env.lookup_variable(variable name(token)) 
elif isdefinition(token): 
return eval definition(line, env) 
elif isquoted(token): 
return text_of_quotation(token) 
Bisen 
procedure = env.procedures.get(token, None) 
return apply_procedure(procedure, line, env) 


ee 了 第 二 个 人 过 程 ， 表达 为 函数 apply_procedure ° 为 了 调用 由 运 云 算 符 记 号 命 
je ， 这 个 运算 符 会 在 当前 环境 中 查找 。 在 上 面 的 定义 中 ， env 是 Environment 类 的 实 

， 会 在 下 一 节 中 描述 。 env.procedures 属性 是 个 储存 运算 符 名 称 和 过 程 之 间 映 射 的 字典 
Logo 中 ， 环 境 拥有 单词 的 这 种 映射 ， 并 且 没 有 局 部 定义 的 过 程 。 而 且 ，Logo 为 过 程 名 称 
和 变量 名 称 维护 分 离 的 映射 ， 叫 做 分 离 的 命名 空间 。 但 是 ， 以 这 种 方式 复 用 名 称 并 不 推荐 。 


过 程 调用 。 过 程 调用 以 调用 apply_procedure 函数 开始 ， 它 被 传 入 由 10go_apply 查找 到 的 遂 
数 ， 并 带 有 代码 的 当前 行 和 当前 环境 。 Logo 中 过 程 调 用 的 过 程 比 计算 器 中 的 calc _apply 更 加 
通用 。 特 别 是 ， apply_procedure 必须 检查 打算 调用 的 过 程 ， 以 便 在 求解 n 个 运算 符 表达 式 
之 前 ， 判 断 它 的 参数 数量 n 。 这 里 我 们 会 看 到 ， 为 什么 Logo 解析 器 不 能 仅仅 由 语法 分 析 构 
建 表 达 式 树 ， 因 为 树 的 结构 由 过 程 决 定 。 


apply_procedure 函数 调用 collect_args 况 数 ， 它 必 须 重复 调用 Jogo_eval 来 求解 行 中 的 
下 n 个 表达 式 。 之 后 ， 计 算 完 过 程 的 参数 之 后 ，apply_procedure 调用 了 logo_apply ， 实 际 
上 这 个 函数 在 参数 上 调用 过 程 。 下 面 的 调用 图 示 展 示 了 这 个 过 程 。 


~、 


Apply a named procedure | apply_procedu re | Return the output value 


a 








”i 


Evaluate n operands | COLLect_args Return n arguments 


A/ 





Apply a procedure to 


Re | logo_apply | Return the output value 


最 终 的 函数 logo_apply 接受 两 种 参数 : 基本 过 程 和 用 户 定义 的 过 程 ， 二 者 都 是 Procedure 的 
实例 。 procedure 是 一 个 Python 对 象 ， 它 拥有 过 程 的 名 称 、 参 数 数量 、 主 体 和 形式 参数 作为 
实例 属性 。 body 属性 可 以 拥有 不 同类 型 。 基 本 过 程 在 Python 中 已 经 实现 ， 所 以 它 

的 body 就 是 Python 函数 。 用 户 定 义 的 过 程 〈 非 基本 ) 定义 在 Logo 中 ， 所 以 它 的 body 就 
是 Logo 代码 行 的 列表 。 procedure 也 拥有 两 个 布尔 值 属性 。 一 个 用 于 表明 是 否 是 基本 过 程 ， 
另 一 个 用 于 表明 是 否 需 要 访问 当前 环境 。 


>>>°cClass procedurel(): 
def init_ (self, name, arg_count, body, isprimitive=False, 
needs_env=False, formal_ params=None): 
self.name = name 
self.arg_count = arg_count 
self.body = body 
self.isprimitive = isprimitive 
self.needs env = needs_env 
self.formal_ params = formal_params 


基本 过 程 通过 在 参数 列表 上 调用 主体 ， 并 返回 它 的 返回 值 作 为 过 程 输出 来 应 用 。 


>>> def logo apply(proc, args): 
“Apply a logoprocedurne to anlnst ofmvargumentse 
If proc.isprimitive: 
return proc.body(*args) 
else: 
"Apply a user=defined procedure 


用 户 定义 过 程 的 主体 是 代码 行 的 列表 ， 每 一 行 都 是 Logo 句子 。 为 了 在 参数 列表 上 调用 过 程 ， 
我 们 在 新 的 环境 中 求 出 主体 的 代码 行 。 为 了 构造 这 个 环境 ， 我 们 向 当前 环境 中 添加 新 的 帧 ， 
过 程 的 形式 参数 在 里 面 绑 定 到 实 参 上 。 这 个 过 程 的 重要 结构 化 抽象 是 ， 求 出 用 户 定义 过 程 的 
主体 的 代码 行 ， 需 要 递归 调用 eval line 。 


求 值 /应 用 递归 。 实 现 求 值 过 程 的 函数 ，eval line 和 logo eval ， 以 及 实现 函数 应 用 过 程 的 
函数 ，apply_procedure 、 collect args 和 logo apply ， 是 互相 递归 的 。 无 论 何 时 调用 表达 
式 被 发 现 ， 0 它 。 应 用 操作 使 用 = 来 求 出 实 参 中 的 操作 数 表达 式 ， 以 及 
求 出 用 户 定义 过 程 的 主体 。 这 个 互相 递归 过 程 的 通用 结构 在 解释 器 中 非常 常见 : 求 值 以 应 用 
定义 ， 应 用 又 使 用 求 值 定义 。 








Eval 
攻 logo_eval 


mit 


apply_procedure 


[gm 


logo_apply 
这 个 递归 循环 终止 于 语言 的 基本 类 型 。 求 值 的 基本 条 件 是 ， 求 解 基 本 表达 式 、 变 量 、 引 用 表 
达 式 或 定义 。 前 数 调用 的 基本 条 件 是 调用 基本 过 程 。 这 个 互相 北 归 的 结构 ， 在 处 理 表 达 式 形 
式 的 求 值 函数 ， 和 处 理 函 数 及 其 参数 的 应 用 之 间 ， 构 成 了 求 值 过 程 的 本 质 。 





Apply 





3.6.4 环境 


既然 我 们 已 经 描述 了 Logo 解释 器 的 结构 ， 我 们 转 而 实现 Environment 类 ， 便 于 让 它 使 用 动态 
作用 域 正 确 支 持 赋值 、 过 程 定 义 和 变 量 查找 。 Environment 实例 表示 名 称 绑 定 的 共有 集合 ， 可 
以 在 程序 执行 期 间 的 某 一 点 上 访问 。 绑 定 在 帧 中 组 织 ， 而 帧 以 Python 字典 实现 。 帧 包含 变量 
的 名 称 绑 定 ， 但 不 包含 过 程 。 运 算 符 名 称 和 procedure 实例 之 间 的 绑 定 在 Logo 中 是 单独 储存 
的 。 在 这 个 实现 中 ， 和 包含 变量 名 称 绑 定 的 帧 储存 为 字典 的 列表 ， 位 

于 Environment 的 _frames 属性 中 ， 而 过 程 名 称 绑 定 储 存在 值 为 字典 的 procedures 属性 中 。 


帧 不 能 直接 访问 ， 而 是 通过 两 个 Environment 的 方 

法 : lookup_variable 和 set_variable value 。 前 者 实现 了 一 个 过 程 ， 与 我 们 在 第 一 章 的 计算 
环境 模型 中 引入 的 查找 过 程 相同 。 名 称 在 当前 环境 第 一 帧 〈 最 新 添加 ) 中 与 值 匹 配 。 如 果 它 
被 找到 ， 所 绑 定 的 值 会 被 返回 。 如 果 没 有 找到 ， 会 在 被 当前 帧 扩展 的 帧 中 寻找 。 


set_variable value 也 会 寻找 与 变量 名 称 匹配 的 绑 定 。 如 果 找 到 了 ， 它 会 更 新 为 新 的 值 ， 如 
果 没 有 找到 ， 那 么 会 在 全 局 帧 上 创建 新 的 绑 定 。 这 些 方法 的 实现 留 做 配套 项 目 中 的 练习 。 


lookup_variable 方法 在 求解 变量 名 称 时 由 logo_eval 调 
用 。 set_variable_ value 由 logo_make 函数 调用 ， 它 用 作 Logo 中 make 基本 过 程 的 主体 。 
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量 和 make 基本 过 程 之 外 ， 我 们 的 解释 器 支持 它 的 第 一 种 抽象 手段 : 将 名 称 绑 定 到 值 
汪 。 . Logo 中 ， 我 们 现在 可 以 重复 我 们 第 一 章 中 的 第 一 种 抽象 步骤 。 


? make "radius 10 
? print 2 * :radius 
20 


赋值 只 是 抽象 的 一 种 有 限 形式 。 我 们 已 经 从 这 门 课 的 开始 看 到 ， 即 使 对 于 不 是 很 大 的 程序 ， 
用 户 定义 函数 也 是 管理 复杂 性 的 关键 工具 。 我 们 需要 两 个 改进 来 实现 Logo 中 的 用 户 定义 过 
程 。 首 先 ， 我 们 必须 描述 eval definition 的 实现 ， 如 果 当 前 行 是 定义 ， logo_eval 会 调用 这 
个 Python 函数 。 其 次 ， 我 们 需要 在 logo_apply 中 完成 我 们 的 描述 ， 它 在 一 些 参 数 上 调用 用 
户 过 程 。 这 两 个 改动 都 需要 利用 上 一 节 定 义 的 procedure 类 。 


定义 通过 创建 新 的 Procedure 实例 来 求 值 ， 它 表示 用 户 定义 的 过 程 。 考 虑 下 面 的 Logo 过 程 定 


? to factorial :n 

> output ifelse :n = 1 [1] [:n * factorial :n - 1] 
> end 

? print fact 5 
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定义 的 第 一 行 提供 了 过 程 的 名 称 factorial 和 形 参 n 。 随 后 的 一 些 行 组 成 了 过 程 体 。 这 些 行 
并 不 会 立即 求 值 ， 而 是 为 将 来 使 用 而 储存 。 也 就 是 说 ， 这些 行 由 eval_definition 读 取 并 解 
析 ， 但 是 并 不 传递 给 eval_ line 。 主 体 中 的 行 一 直 读 取 ， 直 到 出 现 了 只 包含 end 的 行 。 在 
Logo 中 ， end 并 不 是 需要 求 值 的 过 程 ， 也 不 是 过 程 体 的 一 部 分 。 它 是 个 函数 定义 末尾 的 语法 
标记 。 


Procedure 实例 从 这 个 过 程 的 名 称 、 形 参 列表 以 及 主体 中 创建 ， 并 且 在 环境 中 
的 procedures 的 字典 属性 中 注册 。 不 像 Python， 在 Logo 中 ， 一 旦 过 程 绑 定 到 一 个 名 称 ， 其 
它 定 义 都 不 能 复 用 这 个 名 称 。 


logo_apply 将 Procedure 实例 应 用 于 一 些 参 数 ， 它 是 表示 为 字符 串 的 Logo 值 《对 于 单 

词 ) ， 或 列表 〈 对 于 儿子) 。 对 于 用 户 定 义 过 程 ， logo_apply 创 人 ， 它 是 一 个 字典 
对 象 ， 键 是 过 程 的 形 参 ， 值 是 实 参 。 在 动态 作用 域 语言 例如 Logo 中 ， 这 个 新 的 帧 总 是 扩展 自 
过 程 调用 处 的 当前 环境 。 所 以 ， 我 们 将 新 创建 的 帧 附加 到 当前 环境 上 上。 之后， 主体 中 的 每 一 
行 都 依次 传递 给 eval_line 。 有 最后， 在 主体 完成 求 值 后 ， 我 们 可 以 从 环境 中 移 除 新 创建 的 
帧 。 由 于 Logo 并 不 支持 高 阶 或 一 等 过 程 ， 在 程序 执行 期 间 ， 我 们 并 不 需要 一 次 跟踪 多 于 一 个 
环境 。 


下 面 的 例子 演示 了 帧 的 列表 和 动态 作用 域 规则 ， 它 们 由 调用 这 两 个 Logo 用 户 定义 过 程 产 生 : 


to FX 

make "z sum :x :y 
end 

tog :x :y 

Sum :xX x 

end 

gS 

print :Zz 


ms 0 


CD 


由 这 些 表达 式 的 求 值 创 建 的 环境 分 为 过 程 和 帧 ， 它 们 维护 在 分 离 的 命名 空间 中 。 帧 的 顺序 由 
调用 顺序 决定 。 


FRAMES PROCEDURES 


国光 | 
| make “Zz Sum 3X sy 












3.6.5 数据 即 程序 


在 思考 求 值 Logo 表达 式 的 程序 时 ， 一 个 类 比 可 能 很 有 帮助 。 程 序 含义 的 一 个 可 取 观 点 是 ， 程 
序 是 抽象 机 器 的 描述 。 例 如 ， 再 次 思考 下 面 的 计 草 阶乘 的 过 程 : 


? to factorial :n 
> output ifelse :n=1 [1] [:n * factorial :n - 1] 
> end 


我 们 可 以 在 Python 中 表达 为 等 价 的 程序 ， 使 用 传统 的 表达 式 。 


>>>°def factorial(n): 
return 1 if n == 1 else n * factorial(n - 1) 


我 们 可 能 将 这 个 程序 看 做 机 器 的 描述 ， 它 包含 几 个 部 分 ， 减 法 、 乘 法 和 相等 性 测试 ， 并 带 有 
两 相 开关 和 另 一 个 阶乘 机 器 〈 阶 乘机 器 是 无 限 的 ， 因 为 它 在 其 中 包含 另 一 个 阶乘 机 器 ) 。 下 
面 的 图 示 是 一 个 阶乘 机 器 的 流程 图 ， 展 示 了 这 些 部 分 是 怎么 组 合 到 一 起 的 。 
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与 之 相似 ， 我 们 可 以 将 Logo 解释 器 看 做 非常 特殊 的 机 器 ， 它 接受 机 器 的 描述 作为 输入 。 给 定 
这 个 输入 ， 解 释 器 就 能 配置 自己 来 模拟 描述 的 机 器 。 例 如 ， 如 果 我 们 向 解释 器 中 输入 阶乘 的 
定义 ， 解 释 器 就 可 以 计 草 阶乘 。 
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从 这 个 观点 得 出 ， 我 们 的 Logo 解释 器 可 以 看 做 通用 的 机 器 。 当 输入 以 Logo 程序 描述 时 ， 它 
就 能 模拟 其 它 机 器 。 它 在 由 我 们 的 编程 语言 操作 的 数据 对 象 ， 和 编程 语言 自身 之 间 起 到 衔接 
作用 。 想 象 一 下 ， 一 个 用 户 在 我 们 正在 运行 的 Logo 解释 器 中 输入 了 Logo 表达 式 。 从 用 户 的 
角度 来 看 ， 类 似 sum 2 2 的 输入 表达 式 是 编程 语言 中 的 表达 式 ， 解 释 器 应 该 对 其 求 值 。 但 
是 ， 从 解释 器 的 角度 来 看 ， 表 达 式 只 是 单词 组 成 的 句子 ， 可 以 根据 定义 好 的 一 系列 规则 来 操 
作 它 。 

用 户 的 程序 是 解释 器 的 数据 ， 这 不 应 该 是 混乱 的 原因 。 实 际 上 ， 有 时 候 忽 略 这 个 差异 会 更 方 
便 ， 以 及 让 用 户 能 够 显 式 将 数据 对 象 求 值 为 表达 式 。 在 Logo 中 ， 无 论 我 们 何 时 使 用 run 过 
程 ， 我 们 都 使 用 了 这 种 能 力 。Python 中 也 存在 相似 的 函数 : eval 函数 会 求 出 Python 表达 
式 ， exec 函数 会 求 出 Python 语句 ， 所 以 : 


>>> eval('2+2') 
4 


和 


>>> 2+2 
4 


返回 了 相同 的 结果 。 求 解构 造 为 指令 的 一 部 分 的 表达 式 是 动态 编程 语言 的 常见 和 强大 的 特 
性 。 这 个 特性 在 Logo 中 十 分 普遍 ， 很 少 语言 是 这 样 ， 但 是 在 程序 执行 期 间 构 造 和 求解 表达 式 
的 能 力 ， 对 任何 程序 员 来 说 都 是 有 价值 的 工具 。 
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4.1 引言 


目前 为 止 ， 我 们 专注 于 如 何 创建 、 解 释 和 执行 程序 。 在 第 一 章 中 ， 我 们 学 会 使 用 函数 作为 组 
合 和 抽象 的 手段 。 第 二 章 展示 了 如 何 使 用 数据 结构 和 对 象 来 表示 和 操作 数据 ， 以 及 向 我 们 介 
绍 了 数据 抽象 的 概念 。 在 第 三 章 中 ， 我 们 学 到 了 计算 机 程序 如 何 解释 和 执行 。 结 果 是 ， 我 们 
理解 了 如 何 设计 程序 ， 它 们 在 单一 处 理 器 上 运行 。 


这 一 章 中 ， 我 们 跳 转 到 协调 多 个 计 草 机 和 处 理 器 的 问题 。 首 先 ， 我 们 会 观察 分 布 式 系统 。 它 
们 是 互相 连接 的 独立 计算 机 ， 需 要 互相 沟通 来 完成 任务 。 它 们 可 能 需要 协作 来 提供 服务 ， 共 
享 数据 ， 或 者 甚至 是 储存 太 大 而 不 能 在 一 台 机 器 上 装 下 的 数据 。 我 们 会 看 到 ， 计 算 机 可 以 在 
分 布 式 系统 中 起 到 不 同 作用 ， 并 且 了 解 各 种 信息 ， 计 算 机 需要 交换 它们 来 共同 工作 。 


接 下 来 ， 我 们 会 考虑 并 行 计算 。 并 行 计算 是 这 样 ， 当 一 个 小 程序 由 多 个 处 理 器 使 用 共享 内 存 
执行 时 ， 所 有 处 理 器 都 并 行 工作 来 使 任务 完成 得 更 快 。 并 发 (或 并 行 ) 引入 了 新 的 挑战 ， 并 
且 我 们 会 开发 新 的 机 制 来 管理 并 发 程序 的 复杂 性 。 


4.2 分 布 式 系统 


分 布 式 系统 是 自主 的 计算 机 网 络 ， 计 算 机 互相 通信 来 完成 一 个 目标 。 分 布 式 系统 中 的 计算 机 
都 是 独立 的 ， 并 且 没 有 物理 上 共享 的 内 存 或 处 理 器 。 它 们 使 用 消息 来 和 其 它 计 算 机 通信 ， 消 
息 是 网 络 上 从 一 台 计 算 机 到 另 一 台 计 算 机 传输 的 一 段 信 息 。 消 息 可 以 用 于 沟通 许多 事情 : 计 
算 机 可 以 让 其 它 计算 机 来 执行 一 个 带 有 特定 参数 的 过 程 ， 它 们 可 以 发 送 和 接受 数据 包 ， 或 者 
发 送信 号 让 其 它 计算 机 执行 特定 行为 。 


分 布 式 系 统 中 的 计算 机 具有 不 同 的 作用 。 计 和 草 机 的 作用 取决 于 系统 的 目标 ， 以 及 计算 机 自身 
的 硬件 和 软件 属性 。 分 布 式 系 统 中 ， 有 两 种 主要 方式 来 组 织 计算 机 ， 一 种 叫 客户 端 -服务 端 架 
构 〈C/S 架构 ) ， 另 一 种 叫做 对 等 网 络 架 构 (P2P 架构 ) 。 


4.2.1 C/S 系统 


C/S 架构 是 一 种 从 中 心 来 源 分 发 服务 的 方式 。 只 有 单个 服务 端 提 供 服务 ， 多 台 客 户 端 和 服务 
器 通信 来 消耗 它 的 产 出 。 在 这 个 架构 中 ， 客 户 端 和 服务 端 都 有 不 同 的 任务 。 服 务 端的 任务 就 
是 响应 来 自 客户 端的 服务 请 求 ， 而 客户 端的 任务 就 是 使 用 响应 中 提供 的 数据 来 执行 一 些 任 


务 。 





C/S 通信 模型 可 以 追溯 到 二 十 世纪 七 十 年 代 Unix 的 引入 ， 但 这 一 模型 由 于 现代 万 维 网 
(WWW) 中 的 使 用 而 变 得 具有 影响 力 。 一 个 C/S 交互 的 例子 就 是 在 线 阅读 纽约 时 报 。 

当 www.nytimes.com 上 的 服务 器 与 浏览 器 客户 端 (比如 Firefox) 通信 时 ， 它 的 任务 就 是 发 送 
回来 纽约 时 报 主页 的 HTML。 这 可 能 涉及 到 基于 发 送 给 服务 器 的 用 户 账 户 信 息 ， 计 算 个 性 化 
的 内 容 。 这 意味 着 需要 展示 图 片 ， 安 排 视觉 上 的 内 容 ， 展 示 不 同 的 颜色 、 字 体 和 图 形 ， 以 及 
允许 用 户 和 泻 当 后 的 页 面 交 互 。 


客户 端 和 服务 端的 概念 是 强大 的 函数 式 抽 象 。 服 务 端 仅仅 是 一 个 提供 服务 的 单位 ， 可 能 同时 
对 应 多 个 客户 端 。 客 户 端 是 消耗 服务 的 单位 。 客 户 端 并 不 需要 知道 服务 如 何 提供 的 细节 ， 或 
者 所 获取 的 数据 如 何 储 存 和 计算 ， 服 务 端 也 不 需要 知道 数据 如 何 使 用 。 


在 网 络 上 ， 我 们 认为 客户 端 和 服务 端 都 是 不 同 的 机 器 ， 但 是 ， 一 个 机 器 上 的 系统 也 可 以 拥有 
C/S 架构 。 例 如 ， 来 自 计 算 机 输入 设备 的 信号 需要 让 运行 在 计算 机 上 的 程序 来 访问 。 这 些 程 
序 就 是 客户 端 ， 消 耗 筷 标 和 键盘 的 输入 数据 。 操 作 系 统 的 设备 驱动 就 是 服务 端 ， 接 受 物理 的 
信号 并 将 它们 提供 为 可 用 的 输入 。 


C/S 系统 的 一 个 缺陷 就 是 ， 服 务 端 是 故障 单 点 。 它 是 唯一 能 够 分 发 服务 的 组 件 。 客 户 端 的 数 
量 可 以 是 任意 的 ， 它 们 可 以 交替 ， 并 且 可 以 按 需 出 现 和 消失 。 但 是 如 果 服 务 器 崩 注 了， 整个 
系统 就 会 停止 工作 。 所 以 ， 由 C/S 架构 创建 的 函数 式 抽象 也 使 它 具 有 前 溃 的 风险 。 

C/S 系统 的 另 一 个 缺陷 是 ， 当 客户 端 非常 多 的 时 候 ， 资 源 就 变 得 稀缺 。 客 户 端 增加 系统 上 的 
命令 而 不 贡献 任何 计算 资源 。C/S 系统 不 能 随 着 不 断 变 化 的 需求 缩小 或 扩大 。 


4.2.2 P2P 系统 


C/S 模型 适合 于 服务 导向 的 情形 。 但 是 ， 还 有 其 它 计算 目标 ， 适 合 使 用 更 加 平等 的 分 工 。P2P 
的 术语 用 于 描述 一 种 分 布 式 系统 ， 其 中 劳动 力 分 布 在 系统 的 所 有 组 件 中 。 所 有 计算 机 发 送 并 
接受 数据 ， 它 们 都 贡献 一 些 处 理 能 力 和 内 存 。 随 着 分 布 式 系统 的 规模 增长 ， 它 的 资源 计算 能 
力也 会 增长 。 在 P2P 系统 中 ， 系 统 的 所 有 组 件 都 对 分 布 式 计算 贡献 了 一 些 处 理 能 力 和 内 存 。 


所 有 参与 者 的 劳动 力 的 分 工 是 P2P 系统 的 识别 特征 。 也 就 是 说 ， 对 等 者 需要 能 够 和 其 它 人 可 
靠 地 通信 。 为 了 确保 消息 到 达 预 定 的 目的 地 ，P2P 系统 需要 具有 组 织 良 好 的 网 络 结 构 。 这 些 
系统 中 的 组 件 协作 来 维护 足够 的 其 它 组 件 的 位 置信 息 并 将 消息 发 送 到 预定 的 目的 地 。 


在 一 些 P2P 系统 中 ， 维 护 网 络 健康 的 任务 由 一 系列 特殊 的 组 件 执行 。 这 种 系统 并 不 是 纯粹 的 
P2P 系统 ， 因 为 它们 具有 不 同类 型 的 组 件 类 型 ， 提 供 不 同 的 功能 。 支 持 P2P 网 络 的 组 件 就 像 
脚手架 那样 : 它们 有 助 于 网 络 保持 连接 ， 它 们 维护 不 同 计 算 机 的 位 置信 息 ， 并 且 它 们 新 来 者 
来 邻居 中 找到 位 置 。 


P2P 系统 的 最 常见 应 用 就 是 数据 传送 和 存储 。 对 于 数据 传送 ， 系 统 中 的 每 台 计 算 机 都 致力 于 
网 络 上 的 数据 传送 。 如 果 目 标 计 算 机 是 特定 计算 机 的 邻居 ， 那 台 计 算 机 就 一 起 帮助 传送 数 
据 。 对 于 数据 存储 ， 数 据 集 可 以 过 于 庞大 ， 不 能 在 任何 单 台 计算 机 内 装 下 ， 或 者 储存 在 单 台 
计算 机 内 具有 风险 。 每 台 计 算 机 都 储存 数据 的 一 小 部 分 ， 不 同 的 计算 机 上 可 能 会 储存 相同 数 
据 的 多 个 副本 。 当 一 人 台 计 算 机 崩溃 时 ， 上 面 的 数据 可 以 由 其 它 副 本 恢复 ， 或 者 在 更 换 蔡 代 品 
之 后 放 回 。 


Skype， 一 个 音频 和 视频 聊天 服务 ， 是 采用 P2P 架构 的 数据 传送 应 用 的 示例 。 当 不 同 计算 机 
上 的 两 个 人 都 使 用 Skype 交谈 时 ， 它 们 的 通信 会 拆 成 由 1 和 0 构成 的 数据 包 ， 并 且 通 过 P2P 
网 络 传播 。 这 个 网 络 由 电脑 上 注册 了 Skype 的 其 它 人 组 成 。 每 台 计算 机 都 知道 附近 其 它 人 的 
位 置 。 一 台 计 算 机 通过 将 数据 包 传 给 它 的 邻居 ， 来 帮助 将 它 传 到 目的 地 ， 它 的 邻居 又 将 它 传 
给 其 它 邻居 ， 以 此 类 推 ， 直 到 数据 包 到 达 了 它 预定 的 目的 地 。Skype 并 不 是 纯粹 的 P2P 系 

统 。 一 个 超级 节点 组 成 的 脚手架 网 络 用 于 用 户 登 录 和 退出 ， 维 护 它们 的 计算 机 的 位 置信 息 ， 

并 且 修 改 网 络 结构 来 处 理 用 户 进 入 和 离开 。 


4.2.3 模块 化 


我 们 刚才 考虑 的 两 个 架构 -- P2P 和 C/S -- 都 为 强制 模块 化 而 设计 。 模 块 化 是 一 个 概念 ， 系 统 
的 组 件 对 其 它 组 件 来 说 应 该 是 个 黑 盒 。 组 件 如 何 实现 行为 应 该 并 不 重要 ， 只 要 它 提 供 了 一 个 
接口 : 规定 了 输入 应 该 产生 什么 输出 。 


在 第 二 章 中 ， 我 们 在 调度 函数 和 面向 对 象 编程 的 上 下 文中 遇 到 了 接口 。 这 里 ， 接 口 的 形式 为 
指定 对 象 应 接收 的 信息 ， 以 及 对 象 应 如 何 响应 它们 。 例 如 ， 为 了 提供 “表示 为 字符 串 " 的 接口 ， 
对 象 必 须 回 复 _repr 和 _str 信息 ， 并 且 在 响应 中 输出 合适 的 字符 串 。 那 些 字符 串 的 生 
成 如 何 实现 并 不 是 接口 的 一 部 分 。 





在 分 布 式 系统 中 ， 我 们 必须 考虑 涉及 到 多 台 计 草 机 的 程序 设计 ， 所 以 我 们 将 接口 的 概念 从 对 
象 和 消息 扩展 为 整个 程序 。 接 口 指定 了 应 该 接受 的 输入 ， 以 及 应 该 在 响应 中 返回 给 输入 的 输 
出 。 


接口 在 真实 世界 的 任何 地 方 都 存在 ， 我 们 经 常 习以为常 。 一 个 熟悉 的 例子 就 是 TV 喧 控 器 。 你 
可 以 买 到 许多 牌子 的 歼 控 器 或 者 TV， 它们 都 能 工作 。 它 们 的 唯一 共同 点 就 是 TV 中 控 器 "的 接 
口 。 只 要 当 你 按 下 电 院 、 音 量 、 频 道 或 者 其 它 任 何 按 钮 (输入 ) 时， 一块 电路 向 你 的 TV 发 送 
正确 的 信号 (输出) ， 它 就 遵循 “TV 踪 控 器 "接口 。 


模块 化 给 予 系统 许多 好 处 ， 并 且 是 一 种 沉思 熟 虑 的 系统 设计 。 首 先 ， 模块 化 的 系统 萄 于 理 
解 。 这 使 它 多 于 修改 和 扩展 。 其 次 ， 如 果 系 统 中 什么 地 方 发 生 错误 ， 只 需要 更 换 有 错误 的 组 
件 。 再 者 ，bug 或 故障 可 以 轻易 定位 。 如 果 组 件 的 输出 不 符合 接口 的 规定 ， 而 且 输 入 是 正确 
的 ， 那 么 这 个 组 件 就 是 故障 来 源 。 


4.2.4 消息 传递 


在 分 布 式 系统 中 ， 组 件 使 用 消息 传递 来 互相 沟通 。 消 息 有 三 个 必要 部 分 : 发 送 者 、 接 收 者 和 
内 容 。 发 送 者 需要 被 指定 ， 便 于 接受 者 得 知 哪个 组 件 发 送 了 信息 ， 以 及 将 回复 发 送 到 哪里 。 
接收 者 需要 被 指定 ， 便 于 任何 协助 发 送 消息 的 计算 机 知道 发 送 到 哪里 。 消 息 的 内 容 是 最 宝贵 
的 。 取 决 于 整个 系统 的 函数 ， 内 容 可 以 是 一 段 数据 、 一 个 信号 ， 或 者 一 条 指令 ， 让 远程 计算 
机 来 以 一 些 参数 求 出 某 个 函数 。 


消息 传递 的 概念 和 第 二 章 的 消息 传递 机 制 有 很 大 关系 ， 其 中 ， 调 度 函 数 或 字典 会 响应 值 为 字 
符 串 的 信息 。 在 程序 中 ， 发 送 者 和 接受 者 都 由 求 值 规则 标识 。 但 是 在 分 布 式 系统 中 ， 接 受 者 
和 发 送 者 都 必须 显 式 编码 进 消 息 中 。 在 程序 中 ， 使 用 字符 串 来 控制 调度 函数 的 行为 十 分 方 
便 。 在 分 布 式 系统 中 ， 消 息 需 要 经 过 网 络 发 送 ， 并 且 可 能 需要 存放 许多 不 同 种 类 的 信号 作 
为 “数据 *， 所 以 它们 并 不 始终 编码 为 字符 囊 。 但 是 在 两 种 情况 中 ， 消 息 都 服务 于 相同 的 函数 。 
不 同 的 组 件 (调度 函数 或 计算 机 ) 交换 消息 来 完成 一 个 目标 ， 它 需要 多 个 组 件 模 块 的 协作 。 


在 较 高 层面 上 ， 消 息 内 容 可 以 是 复杂 的 数据 结构 ， 但 是 在 较 低 层面 上 ， 消 息 只 是 简单 的 1 和 
0 的 流 ， 在 网 络 上 传输 。 为 了 变 得 易 用 ， 所 有 网 络 上 发 送 的 消息 都 需要 根据 一 致 的 消息 协议 格 
式 化 。 


消息 协议 是 一 系列 规则 ， 用 于 编码 和 解码 消息 。 许 多 消息 协议 规定 ， 消 息 必须 符合 特定 的 格 
式 ， 其 中 特定 的 比特 具有 国定 的 含义 。 固 定 的 格式 实现 了 固定 的 编码 和 解码 规则 来 生成 和 读 
取 这 种 格式 。 分 布 式 系统 中 的 所 有 组 件 都 必须 理解 协议 来 互相 通信 。 这 样 ， 它 们 就 知道 消息 
的 哪个 部 分 对 应 哪个 信息 。 


消息 协议 并 不 是 特定 的 程序 或 软件 库 。 反 之 ， 它 们 是 可 以 由 大 量程 序 使 用 的 规则 ， 甚 至 以 不 
同 的 编程 语言 编号。 所 以 ， 带 有 大 量 不 同 软件 系统 的 计算 机 可 以 加 入 相同 的 分 布 式 系统 ， 只 
需要 遵守 控制 这 个 系统 的 消息 协议 。 


4.2.5 万 维 网 上 的 消息 


HTTP (起 文 本 传输 协议 的 缩写 ) 是 万 维 网 所 支持 的 消息 协议 。 它 指定 了 在 Web 浏览 器 和 服 
务 器 之 间 交 换 的 消息 格式 。 所 有 Web 浏览 器 都 使 用 HTTP 协议 来 请 求 服务 器 上 的 页 面 ， 而 且 
所 有 Web 服务 器 都 使 用 HTTP 格式 来 发 回 它 们 的 响应 。 


当 你 在 Web 浏览 器 上 键入 URL 时 ， 比 如 http:Wen.wikipedia.org/wiki/UC_Berkeley， 你 实际 
上 就 告诉 了 你 的 计算 机 ， 使 用 "HTTP" 协议 ， 从 "http://en.wikipedia.org/wiki/UC_Berkeley" 
的 服务 器 上 请 求 "wiki/UC_Berkeley" 页 面 。 消 息 的 发 送 者 是 你 的 计算 机 ， 接 受 者 是 
en.wikipedia.org， 以 及 消息 内 容 的 格式 是 : 


GED /WiKkMUG Berkeley HmmpAd 


第 一 个 单词 是 请 求 类 型 ， 下 一 个 单词 是 所 请 求 的 资源 ， 之 后 是 协议 名 称 《HTTP) 和 版 本 
(1.1) 。 (请 求 还 有 其 它 类 型 ， 例 如 PUT、POST 和 HEAD，Web 浏览 器 也 会 使 用 它 
们 。) 

务 器 发 回 了 回复 。 这 时 ， 发 送 者 是 en.wikipedia.org， 接 受 者 是 你 的 计算 机 ， 消 息 内 容 的 格 
式 是 由 数据 跟随 的 协议 头 : 

HTTP/1.1 200 OK 

Date: Mon, 23 May 2011 22:38:34 GMT 

Server: Apache/1.3.3.7 (Unix) (Red-Hat/Linux) 

Last-Modified: Wed, 08 Jan 2011 23:11:55 GMT 


Content-Type: text/html; charset=UTF-8 


, Web page content ... 
第 一 行 ， 单 词 "200 OK" 表示 没有 发 生 错 误 。 协 议 头 下 面 的 行 提供 了 有 关 服 务 器 的 信息 ， 日 期 
和 发 回 的 内 容 类 型 。 协 议 头 和 页 面 的 实际 内 容 通过 一 个 空 行 来 分 隔 。 


如 果 你 键入 了 错误 的 Web 地 址 ， 或 者 点 击 了 死 链 ， 你 可 能 会 看 到 类 似 于 这 个 错误 的 消息 


404 Error File Not Found 


它 的 意思 是 服务 器 发 送 回 了 一 个 HTTP 协议 头 ， 以 这 样 起 始 : 


HTTP/1.1 404 Not Found 


= ee 列国 定 的 响应 代码 是 消息 协议 的 普遍 特性 。 协 议 的 设计 者 试图 预料 通过 协议 发 送 的 常用 

， 并 且 赋 为 国定 的 代码 来 减少 传送 大 小 ， 以 及 建立 通用 的 消息 语义 。 在 HTTP 协议 中 ， 
ead 而 404 表示 资源 没有 找到 的 错误 。 其 它 大 量 响应 代码 也 存在 于 
HTTP 1.1 标准 中 。 


HTTP 是 用 于 通信 的 国定 格式 ， 但 是 它 允 许 传输 任意 的 Web 页 面 。 其 它 互 联网 上 的 类 似 协 议 
是 XMPP， 即 时 消息 的 常用 协议 ， 以 及 FTP， 用 于 在 客户 端 和 服务 器 之 间 下 载 和 上 传 文件 的 
协议 。 


4.3 并 行 计算 


计算 机 每 一 年 都 会 变 得 越 来 越 快 。 在 1965 年 ， 英 特 尔 联合 创始 人 又 登 . 摩 尔 预测 了 计算 机 将 
如 何 随时 间 而 变 得 越 来 越 快 。 仅 仅 基 于 五 个 数据 点 ， 他 推测 ， 一 个 芯片 中 的 晶体 管 数 量 每 两 
年 将 翻 一 倍 。 近 50 年 后 ， 他 的 预测 仍 惊人 地 准确 ， 现 在 称 为 摩尔 定律 。 


尽管 速度 在 爆炸 式 增长 ， 计 算 机 还 是 无 法 跟 上 可 用 数据 的 规模 。 根 据 一 些 估计 ， 基 因 测 序 技 
术 的 进步 将 使 可 用 的 基因 序列 数据 比 处 理 器 变 得 更 快 的 速度 还 要 快 。 换 句 话说， 对 于 遗传 数 
据 ， 计 算 机 变 得 越 来 越 不 能 处 理 每 年 需要 处 理 的 问题 规模 ， 即 使 计算 机 本 身 变 得 越 来 越 快 。 


为 了 规避 对 单个 处 理 器 速度 的 物理 和 机 械 约 束 ， 制 造 商 正在 转向 另 一 种 解决 方案 : 多 处 理 
器 。 如 果 两 个 ， 或 三 个 ， 或 更 多 的 处 理 器 是 可 用 的 ， 那 么 许多 程序 可 以 更 快 地 执行 。 当 一 个 
处 理 器 在 做 一 些 计算 的 一 个 切面 时 ， 其 他 的 可 以 在 另 一 个 切面 工作 。 所 有 处 理 器 都 可 以 共享 
相同 的 数据 ， 但 工作 并 行 执行 。 

为 了 能 够 合作 ， 多 个 处 理 器 需要 能 够 彼此 共享 信息 。 这 通过 使 用 共享 内 存 环境 来 完成 。 该 环 
境 中 的 变量 、 对 象 和 数据 结构 对 所 有 的 进程 可 见 。 处 理 器 在 计算 中 的 作用 是 执行 编程 语言 的 
求 值 和 执行 规则 。 在 一 个 共享 内 存 模 型 中 ， 不 同 的 进程 可 能 执行 不 同 的 语句 ， 但 任何 语句 都 
会 影响 共享 环境 。 


4.3.1 共享 状态 的 问题 


多 个 进程 之 间 的 共享 状态 具有 单一 进程 环境 没有 的 问题 。 要 理解 其 原因 ， 让 我 们 看 看 下 面 的 
简单 计算 : 


X= 
x = square(x) 
区 全 三 二 全 


x 的 值 是 随时 间 变 化 的 。 起 初 它 是 5， 一 段 时 间 后 它 是 25， 最 后 它 是 26。 在 单一 处 理 器 的 
环境 中 ， 没 有 时 间 依 赖 性 的 问题 。 x 的 值 在 结束 时 总 是 26。 但 是 如 果 存 在 多 个 进程 ， 就 不 能 
这 样 说 了 。 假 设 我 们 并 行 执行 了 上 面 代码 的 最 后 两 行 : 一 个 处 理 器 执行 x = square(x) 而 另 一 
个 执行 x = x + 1 。 每 一 个 这 些 赋值 语句 都 包含 查找 当前 绑 定 到 x 的 值 ， 然 后 使 用 新 值 更 新 
绑 定 。 让 我 们 假设 x 是 共享 的 ， 同 一 时 间 只 有 一 个 进程 读 取 或 写 入 。 即 使 如 此 ， 读 和 写 的 顺 
序 可 能 会 有 所 不 同 。 例 如 ， 下 面 的 例子 显示 了 两 个 进程 的 每 个 进程 的 一 系列 步 
又 ，P1 和 p2 。 每 一 步 都 是 简要 描述 的 求 值 过 程 的 一 部 分 ， 随 时 间 从 上 到 下 执行 : 


P1 P2 
read x: 5 

read x: 5 
calculate 5*5: 25 calculate 5+1: 6 


write 25 -> x 
write x-> 6 


在 这 个 顺序 中 ，x 的 最 终 值 为 6。 如 果 我 们 不 协调 这 两 个 过 程 ， 我 们 可 以 得 到 另 一 个 顺序 的 
不 同 结果 : 


Pd P2 


read x: 5 
read x: 5 calculate 5+1: 6 
calculate 5*5: 25 write x->6 


write 25 -> x 


在 这 个 顺序 中 ，x 将 是 25。 事 实 上 存在 多 种 可 能 性 ， 这 取决 于 进程 执行 代码 行 的 顺 
序 。x 的 最 终 值 可 能 最 终 为 5，25， 或 预期 值 26。 


eh er 决 速 的 计算 。 我 们 强迫 一 条 语句 跑 在 

条 的 后 面 ， 并 不 会 失去 太 多 的 时 间 。 但 是 什么 样 的 情况 下 ， 并 行 化 是 必 不 可 少 的 ? 这 种 
况 的 一 个 例子 是 银行 业 。 在 任何 给 定 的 时 间 ， 可 能 有 成 千 上 万 的 人 想 用 他 们 的 银行 账户 进 
行 交易 : 他 们 可 能 想 在 商店 刷卡 ， 存 入 支票 ， 转 帐 ， 或 支付 账单 。 即 使 一 个 帐户 在 同一 时 间 
也 可 能 有 活跃 的 多 个 交易 。 


Ed 的 版 本 ， 在 更 新 余额 之 后 打印 而 不 是 
。 我 们 感 兴 趣 的 是 这 个 函数 将 如 何 并 发 执行 。 


>>> def make withdraw(balance): 
def withdraw(amount ) : 
nonlocal balance 
if amount > balance: 
print('Insufficient funds ' ) 
else: 
balance = balance - amount 
print(balance) 
return withdraw 


现在 想象 一 下 ， I ed 
会 发 生 什 么 。 如 果 我 们 顺序 执行 这 些 交 易 ， 我 们 会 收 到 资金 不 足 的 消息 。 

>>> Ww = make_withdraw(10) 

>>> w(8) 

之 


>>> w(7) 
'Insufficient funds' 


但 是 ， 在 并 行 中 可 以 有 许多 不 同 的 结果 。 下 面 展示 了 一 种 可 能 性 : 


P1: w(8) P2: w(7) 

read balance: 10 

read amount : 8 read balance: 10 

8 > 10: False read amount : 7 

if False 7 > 10: False 

10 - 8: 2 if False 

write balance -> 2 OP:3 

read balance: 2 write balance -> 3 
print 2 read balance: 3 


print 3 


这 个 特殊 的 例子 给 出 了 一 个 不 正确 结果 3。 就 好 像 w(8) 交易 从 来 没有 发 生 过 。 其 他 可 能 的 结 
果 是 2， 和 'Insufficient funds' 。 这 个 问题 的 根源 是 : 如 果 p2 在 Pi 写 入 值 前 读 取 余 
额 ， P2 的 状态 是 不 一 致 的 (反之 蛮 然 ) 。 p2 所 读 取 的 余额 值 是 过 时 的 ， 因 为 p1 打算 改变 
它 。 p2 不 知道 ， 并 且 会 用 不 一 致 的 值 覆盖 它 。 


这 个 例子 表明 ， 并 行 化 的 代码 不 像 把 代码 行 分 给 多 个 处 理 器 来 执行 那样 容易 。 变 量 读 写 的 顺 
序 相当 重要 。 


一 个 保证 执行 正确 性 的 有 吸引 力 的 方式 是 ， 两 个 修改 共享 数据 的 程序 不 能 同时 执行 。 不 幸 的 
是 ， 对 于 银行 业 这 将 意味 着 ， 一 次 只 可 以 进行 一 个 交易 ， 因 为 所 有 的 交易 都 修改 共享 数据 。 
直观 地 说 ， 我 们 明白 ， 让 2 个 不 同 的 人 同时 进行 完全 独立 的 帐户 交易 应 该 没有 问题 。 不 知 何 
故 ， 这 两 个 操作 不 互相 干扰 ， 但 在 同一 帐户 上 的 相同 方式 的 同时 操作 就 相互 干扰 。 此 外 ， 当 
进程 不 读 取 或 写 入 时 ， 让 它们 同时 运行 就 没有 问题 。 


4.3.2 并 行 计算 的 正确 性 


并 行 计算 环境 中 的 正确 性 有 两 个 标准 。 第 一 个 是 ， 结 果 应 该 总 是 相同 。 第 二 个 是 ， 结 果 应 该 
和 闵行 执行 的 结果 一 致 。 


第 一 个 条 件 表 明 ， 我 们 必须 避免 在 前 面 的 章节 中 所 示 的 变化 ， 其 中 在 不 同 的 方式 下 的 交叉 读 
写 会 产生 不 同 的 结果 。 例 子 中 ， 我 们 从 10 美元 的 帐户 取出 了 w(8) 和 w(7) 。 这 个 条 件 表 

明 ， 我 们 必须 始终 返回 相同 的 答案 ， 独 立 于 pl 和 p2 的 指令 执行 顺序 。 无 论 如 何 ， 我 们 必须 
以 这 样 一 种 方式 来 编写 我 们 的 程序 ， 无 论 他 们 如 何 相互 交叉 ， 他 们 应 该 总 是 产生 同样 的 结 

果 。 


第 二 个 条 件 揭示 了 许多 可 能 的 结果 中 哪个 是 正确 的 。 例 子 中 ， 我 们 从 10 美元 的 帐户 取出 
了 w(8) 和 w(7) ， 这 个 条 件 表 明 结 果 必 须 总 是 余额 不 足 ， 而 不 是 2 或 者 3。 


当 一 个 进程 在 程序 的 临界 区 影响 另 一 个 进程 时 ， 并 行 计算 中 就 会 出 现 问题 。 这 些 都 是 需要 执 
行 的 代码 部 分 ， 它 们 看 似 是 单一 的 指令 ， 但 实际 上 由 较 小 的 语句 组 成 。 一 个 程序 会 以 一 系列 
原子 硬件 指令 执行 ， 由 于 处 理 器 的 设计 ， 这 些 是 不 能 被 打 断 或 分 割 为 更 小 单元 的 指令 。 为 了 
在 并 行 的 情况 下 表现 正确 ， 程 序 代码 的 临界 区 需要 具有 原子 性 ， 保 证 他 们 不 会 被 任何 其 他 代 
码 中 断 。 


为 了 强制 程序 临界 区 在 并 发 下 的 原子 性 ， 需 要 能 够 在 重要 的 时 刻 将 进程 序列 化 或 彼此 同步 。 
序列 化 意味 着 同一 时 间 只 运行 一 个 进程 -- 这 一 瞬间 就 好 像 囊 行 执行 一 样 。 同 步 有 两 种 形式 。 
首先 是 互 斥 ， 进 程 轮流 访问 一 个 变量 。 其 次 是 条 件 同步 ， 在 满足 条 件 ( 例 如 其 他 进程 完成 了 
它们 的 任务 ) 之 前 进程 一 直 等 待 ， 之 后 继续 执行 。 这 样 ， 当 一 个 程序 即将 进入 临界 区 时 ， 其 
他 进程 可 以 一 直 等 待 到 它 完成 ， 然 后 安全 地 执行 。 


4.3.3 保护 共享 状态 : 锁 和 信号 量 


在 本 节 中 讨论 的 所 有 同步 和 序列 化 方法 都 使 用 相同 的 基本 思想 。 它 们 在 共享 状态 中 将 变量 用 
作 信 号 ， 所 有 过 程 都 会 理解 并 遵守 它 。 这 是 一 个 相同 的 理念 ， 允 许 分 布 式 系统 中 的 计算 机 协 
同 工 作 -- 它们 通过 传递 消息 相互 协调 ， 根 据 每 一 个 参与 者 都 理解 和 遵守 的 一 个 协议 。 


这 些 机 制 不 是 为 了 保护 共享 状态 而 出 现 的 物理 障碍 。 相 反 ， 他 们 是 建立 相互 理解 的 基础 上 。 
和 出 现在 十 字 路 口 的 各 种 方向 的 车 辆 能 够 安全 通行 一 样 ， 是 同一 种 相互 理解 。 这 里 没有 物理 
的 墙 We a eae sd 止 *， 绿 色 意 味 着 “通行 "。 同样 ， 没 有 什 

么 可 以 保护 这 些 共 享 变量 ， 除 非 当 一 个 特定 的 信号 表明 轮 到 某 个 进程 了 ， 进 程 才 会 访问 它 
们 。 


全 。 锁 ， 也 被 称 为 互 斥 体 ( mutex ) ， 是 共享 对 和 象 ， 常 用 于 发 射 共享 状态 被 读 取 或 修改 的 信 
。 不同 的 编程 语言 实现 锁 的 方式 不 同 ， 但 是 在 Python 中 ， 一 个 进程 可 以 调用 acquire() 方 
和 有 站 程 获 
得 了 一 把 锁 ， 任 何 试图 执行 acquire() 操作 的 其 他 进 程 都 会 自动 等 待 到 锁 被 释放 。 这 样 ， 同 
as 程 可 以 获得 一 把 锁 。 


对 于 一 把 保护 一 组 特定 的 变量 的 锁 ， 所 有 的 进程 都 需要 编程 来 遵循 一 个 规则 : 一 个 进程 不 拥 
有 特定 的 锁 就 不 能 访问 相应 的 变量 。 实 际 上 ， 所 有 进程 都 需要 在 锁 
的 acquire() 和 release() 语句 之 间 “ 包 装 " 自 己 对 共享 变量 的 操作 。 


我 们 可 以 把 这 个 概念 用 于 银行 余额 的 例子 中 。 该 示例 的 临界 区 是 从 余额 读 取 到 写 入 的 一 组 操 
作 。 我 们 看 到 ， 如 果 一 个 以 上 的 进程 同时 执行 这 个 区 域 ， 问 题 就 会 发 生 。 为 了 保护 临界 区 ， 

我 们 需要 使 用 一 把 锁 。 我 们 把 这 把 锁 称 为 balance_lock ( 虽 ee 命名 为 任何 我 们 喜欢 
的 名 字 ) 。 为 了 锁定 实际 保护 的 部 分 ， 我 们 必须 确保 试图 进 部 分 时 调用 acquire() 获取 
Pp sls ee 


>>> from threading import Lock 
>>> def make withdraw(balance): 
balance_lock = Lock() 
def withdraw(amount ) : 
nonlocal balance 
# try to acquire the lock 
balance_lock.acquire() 
# Once successful, enter the critical section 
if amount > balance: 
print("Insufficient funds") 
else: 
balance = balance - amount 
print(balance) 
# Upon exiting the critical section, release the lock 
balance_lock.release() 


如 果 我 们 建立 和 之 前 一 样 的 情形 
w = make_withdraw(10) 


现在 就 可 以 并 行 执行 w(8) 和 w(7) 了 : 


BL P2 
acquire balance_lock: ok 


read balance: 10 acquire balance_lock: wait 
read amount: 8 wait 
8 > 10: False wait 
if False wait 
10 - 8: 2 wait 
write balance -> 2 wait 
read balance: 2 wait 
print 2 wait 
release balance_ lock wait 


acquire balance_lock:ok 
read balance: 2 

read amount: 7 

7> 2 TU 

if True 

print 'Insufficient funds' 
release balance lock 


我 们 看 到 了 ， 两 个 进程 同时 进入 临界 区 是 可 能 的 。 某 个 进程 实例 获取 到 了 balance lock ， 另 
一 个 就 得 等 待 ， 直 到 那个 进程 退出 了 临界 区 ， 它 才能 开始 执行 。 


要 注意 程序 不 会 自己 终止 ， 除 非 pi 释放 了 palance lock 。 如 果 它 没有 释 
放 balance lock ， P2 永远 不 可 能 获取 它 2 而 是 一 直 会 等 待 忘记 释放 获得 的 锁 是 并 行 编程 
中 的 一 个 常见 错误 。 


言 号 量 。 信 号 量 是 用 于 维持 有 限 资 源 访问 的 信号 。 它 们 和 锁 类 似 ， 除 了 它们 可 以 允许 某 个 限 
制 下 的 多 个 访问 。 它 就 像 电梯 一 样 只 能 够 容纳 几 个 人 。 一 旦 达到 了 限制 ， 想 要 使 用 资源 的 进 
程 就 必须 等 待 。 其 它 进程 释放 了 信号 量 之 后 ， 它 才 可 以 获得 。 


例如 ， 假 设 有 许多 进程 需要 读 取 中 心 数 据 库 服务 器 的 数据 。 如 果 过 多 的 进程 同时 访问 它 ， 它 
就 会 前 溃 ， 所 以 限制 连接 数量 就 是 个 好 主意 。 如 果 数 据 库 只 能 同时 支持 N=2 的 连接 ， 我 们 就 
可 以 以 初始 值 N=2 来 创建 信号 量 。 


>>> from threading Import Semaphore 

>>> db_semaphore = Semaphore(2) # set up the semaphore 

>>> database = [] 

>>> def insert(data): 
db_semaphore.acquire() # try to acquire the semaphore 
database.append(data) # if successful, proceed 
db_semaphore,release() # release the semaphore 

>>> insert(7) 

>>> insert(8) 

>>> insert(9) 


信号 量 的 工作 机 制 是 ， 所 有 进程 只 在 获取 了 信号 量 之 后 才 可 以 访问 数据 库 。 只 有 N=2 个 进程 
可 以 获取 信号 量 ， 其 它 的 进程 都 需要 等 到 其 中 一 个 进程 释放 了 信号 量 ， 之 后 在 访问 数据 库 之 


前 尝试 获取 它 。 


P1 P2 P3 


acquire db_semaphore: ok acquire db_semaphore: wait acquire db_semaphore: ok 
read data: 7 wait read data: 9 

append 7 to database wait append 9 to database 
release db_semaphore: ok acquire db_semaphore: ok release db_semaphore: ok 


read data: 8 
append 8 to database 
release db_semaphore: ok 


值 为 1 的 信号 量 的 行为 和 锁 一 样 。 


4.3.4 保持 同步 : 条 件 变量 


条 件 变量 在 并 行 计算 由 一 系列 步骤 组 成 时 非 党 有用。 进程 可 以 使 用 条 件 变量 ， 来 用 信号 告知 
它 完 成 了 特定 的 步 又。 之后， 等待 信号 的 其 它 进 程 就 会 开始 它们 的 任务 。 一 个 需要 逐步 计算 
的 例子 就 是 大 规模 向 量 序列 的 计算 。 在 计算 生物 学 ，Web 范围 的 计算 ， 和 图 像 处 理 及 图 形 学 
中 ， 常 常 需要 处 理 非常 大 型 ( 百 万 级 元 素 ) 的 向 量 和 撼 阵 。 想 象 下 面 的 计算 : 


A = B+C 
V MA 


我 们 可 以 通过 将 矩阵 和 向 量 按 行 拆 分 ， 并 把 每 一 行 分 配 到 单独 的 线程 上 ， 来 并 行 处 理 每 一 
步 。 作 为 上 面 的 计算 的 一 个 实例 ， 想 象 下 面 的 简单 值 : 


0 1 2 
Sa 


YY 
jy 本 
上 人 
品 只 名 
二 
Se 


Pa Vo 一 /IT .A 


在 伪 代 码 中 ， 计 算是 这 样 的 : 


A 


defiidoEstepbETandex 
A[index] = B[index] + C[index] 


defdoEstepE2(andexji 
V[index] = M[index] . A 


do_step_1(1) 
do_step_2(1) 


do_step_1(2) 
do_step_2(2) 


如 果 人 允许 不 带 同 步 处 理 ， 就 造成 下 面 的 不 一 致 性 : 


P1 P2 

read B1: 2 

read C1: 0 

calculate 2+0: 2 

write 2 -> A1 read B2: 0 

read M1: (1 2) read C2: 5 

read A: (2 0) calculate 5+0: 5 
calculate (1 2).(2 0): 2 write 5 -> A2 
write 2 -> V1 read M2: (1 2) 


read A: (2 5) 
calculate (1 2).(2 5):12 
write 12 -> V2 


问题 就 是 v 直到 所 有 元 素 计 算出 来 时 才 会 计算 出 来 。 但 是 ，pP1 在 A 的 所 有 元 素 计 算出 来 之 
前 ， 完 成 A = B+tc 并 且 移 到 Vv = MA 。 所 以 它 与 M 相 乘 时 使 用 了 A 的 不 一 致 的 值 。 


我 们 可 以 使 用 条 件 变量 来 解决 这 个 问题 。 


条 件 变 量 是 表现 为 信号 的 对 象 ， 信 号 表示 某 个 条 件 被 满足 。 它 们 通常 被 用 于 协调 进程 ， 这 些 
进程 需要 在 继续 执行 之 前 等 待 一 些 事情 的 发 生 。 需 要 满足 一 定 条 件 的 进程 可 以 等 待 一 个 条 件 
变量 ， 直 到 其 它 进程 修改 了 条 件 变 量 来 告诉 它们 继续 执行 。 


Python 中 ， 任 何 数 量 的 进程 都 可 以 使 用 condition.wait() 方法 ， 用 信号 告知 它们 正在 等 待 某 
个 条 件 。 在 调用 该 方法 之 后 ， 它 们 会 自动 等 待 到 其 它 进程 调用 

了 condition.notify() 或 condition.notifyAll1() 均 数 。 notify() 方法 值 唤醒 一 个 进程 ， 其 它 
进程 仍旧 等 待 。 notifyAll() 方法 唤醒 所 有 等 待 中 的 进程 。 每 个 方法 在 不 同情 形 中 都 很 实用 。 


由 于 条 件 变 量 通常 和 决定 条 件 是 否 为 趴 的 共享 变量 相 联系 ， 它 们 也 提供 
了 acquire() 和 release() 方法 。 这 些 方法 应 该 在 修改 可 能 改变 条 件 状 态 的 变量 时 使 用 。 任 何 
想 要 用 信号 告知 条 件 已 经 改变 的 进程 ， 必 须 首 先 使 用 acquire() 来 访问 它 。 


在 我 们 的 例子 中 ， 在 执行 
们 可 以 跟踪 已 经 完成 第 


step1 finished = 
start_step2 = Condition() 


我 们 在 do_step_2 的 开头 插入 start _step_2().wait() 
增 step1 finished ， 但 是 我 们 只 会 在 step 1 finished = 


2 


已 。 


step1_ finished = 
start_step2 = Condition() 


defidoEstepEtangdexj 


步 之 前 必须 满足 的 条 件 是 ， 两 个 进 eng 完成 了 第 一 


第 二 
一 步 的 进程 数量 ， 以 及 条 件 是 否 被 满足 ， 


步 。 我 
过 引入 下 面 两 个 变量 


。 每 个 进程 都 会 ed 又 1 之 后 自 
2 时 发 送信 号 。 下 面 的 伪 代 码 展 示 了 


A[index] = B[index] + C[index] 


六 EGGCeSsswEhne 
start_step2.acquire() 
Step1_ finished += 1 


shared state that determines the condition status 


if(step1 finished == 2): # if the condition Is met 
start_step2.notifyAll() # send the signal 

#release access to shared state 
start_step2.release() 

defigdoEsSEepE2U2ndexy 
# wait for the condition 
start_step2.wait() 
V[index] = M[index] . A 

在 引入 条 件 变量 之 后 ， 两 个 进程 会 一 起 进入 步骤 2， 像 下 面 这 样 

P1 P2 

read B1: 2 

read C1: 0 

calculate 2+0: 2 

write 2 -> A1 read B2: 0 

acquire start_step2: ok read C2: 5 


write 1 -> stepi1 finished 
step1_finished == 2: false 
release start_step2: ok 
start_step2: wait 


wait 

wait 
start_step2: ok 
read M1i: (1 2) 
read A:(2 5) 


calculate (1 2). 
write 12->V1 


(2 5): 12 


在 进入 do_step 2 的 时 候 ， pl1 需要 在 start_step 2 之 前 
， 发现 了 它 等 于 2， 之 后 向 条 件 发 送 


了 step1_finished 


4.3.5 死 锁 


calculate 5+0: 5 

write 5-> A2 

acquire start_step2: ok 
write 2-> stepi1 finished 
step1 finished == 2: true 
notifyAll] start_step 2: ok 
start_step2:ok 

read M2: (1 2) 


read A:(2 5) 
calculate (1 2). 
write 12->V2 


(2 5): 12 


和 等待 ， 直 到 p2 自 增 
信号 。 


站 


虽然 同步 方法 对 保护 共享 状态 十 分 有 效 ， 但 它们 也 带 来 了 麻烦 。 因 为 它们 会 导致 一 个 进程 等 
待 另 一 个 进程 ， 这 些 进程 就 有 死 锁 的 风险 。 死 锁 是 一 种 情形 ， 其 中 两 个 或 多 个 进程 被 卡 住 ， 
互相 等 待 对 方 完 成 。 我 们 已 经 提 到 了 忘记 释放 某 个 锁 如 何 导 致 进程 无 限 卡 住 。 但 是 即 

使 acquire() 和 release() 调用 的 数量 正确 ， 程 序 仍然 会 构成 死 锁 。 


死 锁 的 来 源 是 循环 等 待 ， 像 下 面 展示 的 这 样 。 没 有 进程 能 够 继续 执行 ， 因 为 它们 正在 等 待 其 


它 进程 ， 而 其 它 





‘waiting for 


waiting for 


进程 也 在 等 待 它 完 成 。 






‘waiting for 


作为 一 个 例子 ， 我 们 会 建立 两 个 进程 的 死 锁 。 假 设 有 两 把 锁 ，x_lock 和 y lock ， 并 且 它 们 


像 这 样 使 用 : 

>>> x_lock = Lock() 

>>> y_lock = Lock() 

>>>3X3=>1] 

>>>y=0 

>>> def compute( ): 
x_lock.acquire() 
y_lock.acquire() 
YX 
X =X 
y_lock.release() 
x_lock.release() 

>>> def anti compute( ): 


y_lock.acquire() 
x_lock.acquire() 
Vs 

x = sqrt(x) 
x_lock.release() 
y_lock.release() 


如 果 compute() 和 anti compute() 并 行 执行 ， 并 且 恰 好 像 下 面 这 样 互相 交错 : 


P1 


acquire x_lock: ok 
acquire y_lock: wait 


wait 
wait 
wait 


P2 

acquire y_lock: ok 
acquire x_lock: wait 
wait 

wait 

wait 


所 产生 的 情形 就 是 死 锁 。 P1 和 p2 每 个 都 持 有 一 把 锁 ， 但 是 它们 需要 两 把 锁 来 执行 。 p1 正 
在 等 待 P2 释放 y_lock ， 而 P2 正在 等 待 P1 释放 x_lock ° 所 以 ， 没有 进程 能 够 继续 执行 2 


第 五 章 序列 和 协 程 


来 源 : Chapter 5: Sequences and Coroutines 
译 者 : 飞龙 


协议 : CC BY-NC-SA 4.0 


5.1 引言 


在 这 一 章 中 ， 我 们 通过 开发 新 的 工具 来 处 理 有 序数 据 ， 继 续 讨论 丨 实 世 界 中 的 应 用 。 在 第 二 
章 中 ， 我 们 介绍 了 序列 接口 ， 在 Python 内 置 的 数据 类 型 例如 tuple 和 list 中 实现 。 序 列 支 
持 两 个 操作 : 获取 长 度 和 由 下 标 访问 元 素 。 第 三 章 中 ， 我 们 开发 了 序列 接口 的 用 户 定义 实 
现 ， 用 于 表示 递归 列表 的 Rlist 类 。 序 列 类 型 具有 高 效 的 表现 力 ， 并 且 可 以 让 我 们 高 效 访问 
大 量 有 序数 据 集 。 

但 是 ， 使 用 序列 抽象 表示 有 序数 据 有 两 个 重要 限制 。 第 一 个 是 长 度 为 n 的 序列 的 要 占据 比例 
为 n 的 内 存 总 数 。 于 是 ， 序 列 越 长 ， 表 示 它 所 占 的 内 存 空间 就 越 大 。 


第 二 个 限制 是 ， 序 列 只 能 表示 已 知 且 长 度 有 限 的 数据 集 。 许 多 我 们 想 要 表示 的 有 序 集合 并 没 
有 定义 好 的 长 度 ， 甚 至 有 些 是 无 限 的 。 两 个 无 限 序 列 的 数学 示例 是 正 整 数 和 辈 波 那 契 数 。 无 
限 长 度 的 有 序数 据 集 也 出 现在 其 它 计算 领域 ， 例 如 ， 所 有 推 特 状态 的 序列 每 秒 都 在 增长 ， 所 
以 并 没有 国定 的 长 度 。 与 之 类 似 ， 经 过 基站 发 送出 的 电话 呼叫 序列 ， 由 计算 机 用 户 发 出 的 鼠 
标 动作 序列 ， 以 及 飞机 上 的 传感器 产生 的 加 速度 测量 值 序列 ， 都 在 世界 演化 过 程 中 无 限 扩 
展 。 


在 这 一 章 中 ， 我 们 介绍 了 新 的 构造 方式 用 于 处 理 有 序数 据 ， 它 为 容纳 未 知 或 无 限 长 度 的 集合 
而 设计 ， 但 仅仅 使 用 有 限 的 内 存 。 我 们 也 会 讨论 这 些 工 具 如 何 用 于 一 种 叫做 协 程 的 程序 结 
构 ， 来 创建 高 效 、 模 块 化 的 数据 处 理 流水 线 。 


5.2 隐 式 序列 


序列 可 以 使 用 一 种 程序 结构 来 表示 ， 它 不 将 每 个 元 素 显 式 储 存在 内 存 中 ， 这 是 高 效 处 理 有 序 
数据 的 核心 概念 。 为 了 将 这 个 概念 用 于 实践 ， 我 们 需要 构造 对 象 来 提供 序列 中 所 有 元 素 的 访 
问 ， 但 是 不 要 事先 把 所 有 元 素 计算 出 来 并 储存 。 


这 个 概念 的 一 个 简单 示例 就 是 第 二 章 出 现 的 range 序列 类 型 。 range 表示 连续 有 界 的 整数 序 
列 。 但 是 ， 它 的 每 个 元 素 并 不 显 式 在 内 存 中 表示 ， 当 元 素 从 range 中 获取 时 ， 才 被 计算 出 
来 。 所 以 ， 我 们 可 以 表示 非常 大 的 整数 范围 。 只 有 范围 的 结束 位 置 才 被 储存 为 range 对 象 的 

一 部 分 ， 元 素 都 被 凭空 计算 出 来 。 


>>>『 = range(10000, 1000000000) 
>>> r[45006230] 
45016230 


这 个 例子 中 ， 当 构造 范围 示例 时 ， 并 不 是 这 个 范围 内 的 所 有 999,990,000 个 整数 都 被 储存 。 
反之 ， 范 围 对 象 将 第 一 个 元 素 10,000 a 45,006,230 来 产生 第 45,016,230 个 元 素 。 
计算 所 求 的 元 素 值 并 不 从 现 有 的 表示 中 获取 ， 这 是 惰性 计算 的 一 个 例子 。 计 算 机 科学 将 情 性 
作为 一 种 重要 的 计算 工具 加 以 赞扬 。 


迭代 器 ede ey 问 的 对 和 象 。 器 在 许多 编程 语言 中 都 是 内 建 对 象 ， 

包括 Python。 器 抽象 拥有 两 个 组 成 部 分 : te。 元 素 序列 的 下 一 个 元 素 的 机 制 ， 
以 及 一 re 。 在 带 有 内 建 对 象 系统 的 纺 
程 语言 中 ， 这 个 抽象 通常 相当 于 可 以 由 类 实现 的 特定 接口 。Python 的 近代 器 接口 会 在 下 一 节 
中 描述 。 


迭代 器 的 实用 性 来 源 于 一 个 事实 ， 底 层 数 据 序列 并 不 能 显 式 在 内 存 中 表达 。 迭 代 器 提供 了 一 
es ， 本 但 是 所 有 元 素 不 需要 连续 储存 。 反 之 ， 当 下 个 元 素 
迭代 器 获取 的 时 候 ， 这 个 元 素 会 按照 请 求 计算 ， 而 不 是 从 现 有 的 内 存 来 源 中 获取 。 


范围 可 以 情 性 计算 序列 中 的 元 素 ， Re 统一 的 ， 并 且 任 何 元 素 都 可 以 轻易 从 范 
围 的 起 始 和 结束 位 置 计 算出 来 。 选 ee 性 生成 ， 它们 
不 需要 提供 底层 序列 任意 圣 。 反 之 ， 它 们 仅仅 需要 按照 顺序 ， 在 每 次 元 素 
被 请 求 的 时 候 ， ss 虽然 不 像 序列 可 访问 任意 元 素 那 样 灵 活 
机 访问 ) ， 有 序数 据 序列 的 顺序 访问 对 于 数据 处 理应 用 来 说 已 经 足够 了 。 


5.2.1 Python 迭代 器 


Python 迭代 器 接口 包含 两 个 消息 。 _next ”消息 向 迭代 器 获取 所 表示 的 底层 序列 的 下 一 个 元 
素 。 为 了 对 _next ”方法 调用 做 出 回应 ， 和 迭代 器 可 以 执行 任何 计算 来 获取 或 计算 底层 数据 序 

列 的 下 一 个 元 素 。 _next_ 的 调用 让 迭代 器 产生 变化 : 它们 向 前 移动 迭代 器 的 位 置 。 所 以 多 

次 调用 _next 会 有 序 返 回 底层 序列 的 元 素 。 在 _next 的 调用 过 程 中 ，Python 通 

过 stopIteration 异常 ， 来 表示 底层 数据 序列 已 经 到 达 末 尾 。 


下 面 的 Letters 类 迭代 了 从 a 到 d 字母 的 底层 序列 。 成 员 变量 current 储存 了 序列 中 的 当前 
字母 。 _next_ 方法 返回 这 个 字母 ， 并 且 使 用 它 来 计算 current 的 新 值 。 


>>>>class Letters(object): 

def uNniteal(serry: 
self.current = 'a!' 

def next ‘(selfy: 
lif"Self current > a: 

raise StopIteration 

result = self.current 
self.current = chr(ord(result)+1) 
return result 

def ntere (serry: 
return self 


_iter 消息 是 Python 迭代 器 所 需 的 第 二 个 消息 。 它 只 是 简单 返回 迭代 器 ， 它 对 于 提供 迭 
代 器 和 序列 的 通用 接口 很 有 用 ， 在 下 一 节 会 描述 。 


使 用 这 个 类 ， 我 们 就 可 以 访问 序列 中 的 字母 : 


>>> letters = Letters() 

>>> letters. next__() 

(sd 

>>> letters. next_ _() 

a 

>>> letters. next_ _() 

Le 

>>> letters. next__() 

ug 

>>> letters. next_ __() 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 12, in next 

StopIteration 


Letters 示例 只 能 迭代 一 次 。 一 旦 next () 方法 产生 了 stopIteration 异常 ， 它 就 从 此 之 
后 一 直 这 样 了 。 除 非 创建 新 的 实例 ， 否 则 没有 办 法 来 重 置 它 。 


实现 永远 不 会 产生 stopIteration 异常 的 _next_ 方 


迭代 器 也 允许 我 们 表示 无 限 序列 ， 通 过 
类 和 欠 代 了 正 整 数 的 无 限 序列 : 


法 。 例 如 ， 下 面 展示 的 Positives 


>>> class Positives(object): 

def init (self): 
self.current = 0; 

def next (se1lf): 
result = self.current 
self.current += 1 
return result 

def Titer /serfy): 
return self 


5.2.2 for 语句 


Python 中 ， 序 列 可 以 通过 实现 _iter ”消息 用 于 和 迭代 。 et 
在 for 语 多 中 用 作 可 和 迭代 对 象 ， 通 过 回应 _ iter ”消息 来 返回 迭代 器 。 这 个 迭代 器 应 拥 

有 _next_() 方法 ， 依 次 返回 序列 中 的 每 个 元 素 ， 最 后 到 达 序 列 末尾 时 产 

生 StopIteration 异常 。 


>>> counts = [1, 2, 3] 

>>> for item in counts: 
print(item) 

lL 

之 


在 上 面 的 实例 中 ， counts 列表 返回 了 和 迭代 器 ， 作 为 _iter () 方法 调用 的 回应 。 for 语句 
es 失 代 器 的 _next_() 方法 ， 并 且 每 次 都 将 返回 值 赋 给 item 。 这 个 过 程 一 直 持 
直到 迭代 器 产生 了 stopIteration 异常 ， 这 时 for 语句 就 终止 了 。 


使 用 我 们 关于 和 迭代 器 的 知识 ， 我 们 可 以 拿 while 、 赋 值 和 try 语句 实现 for 语句 的 求 值 规 
则 : 


>>> i = counts. iter_  () 
>> > 
while True: 
item = i. next__() 


print(item) 
except StopIteration: 
pass 
a 
人 
3 


在 上 面 ， 调 用 counts 的 iter 方法 所 返回 的 迭代 器 绑 定 到 了 名 称 i 上 面 ， 便 于 依次 获取 
每 个 元 素 。 stopIteration 异常 的 处 理子 名 不 做 任何 事情 ， 但 是 这 个 异常 的 处 理 提供 了 退 
出 while 循环 的 控制 机 制 。 


5.2.3 生成 器 和 yield 语句 


上 面 的 Letters 和 Positives 对 象 需要 我 们 引入 一 种 新 的 字段 ， self.current ， 来 跟踪 序列 
的 处 理 过 程 。 在 上 面 所 示 的 简单 序列 中 ， ee 。 但 对 于 复杂 序列 ， _next_() 很 
难 在 计算 中 节省 空间 。 生 成 器 允许 我 们 通过 利用 Python 解释 器 的 特性 定义 更 复杂 的 迭代 。 


生成 器 是 由 一 类 特殊 函数 ， 叫 做 生成 器 函数 返回 的 先 代 器 。 生 成 器 函数 不 同 于 普通 的 函数 ， 
因为 它 不 在 函数 体 中 包含 return 语 钉 ， 而 是 使 用 yield 语 名 来 返 回 序 列 ] 中 的 元 素 。 


生成 器 不 使 用 任何 对 象 属性 来 跟踪 序列 的 处 理 过 程 。 它 们 控制 生成 器 函数 的 执行 ， 
次 _next _ 方法 调用 时 ， 它 们 执行 到 下 一 个 yield 语句 。 Letters 迭代 可 以 使 用 和 数 
实现 得 更 加 简洁 。 


>>> def letters ne 
Current = "a' 
while Errent “=a 
yield current 
current = chr(ord(current)+1) 
>>> for letter in letters_generator(): 
print(letter) 


Ey er 


即使 我 们 永 不 显 式 定义 _iter () 或 _next () 方法 ，Python 会 理解 当 我 们 使 用 yield 语 
名 时 ， 我 们 打算 定义 生成 器 函数 。 调 用 时 ， 生 成 器 函数 并 不 返回 特定 的 产 出 值 ， 而 是 返回 一 
个 生成 器 (一 种 迭代 器 ) ， 它 自己 就 可 以 返回 产 出 的 值 。 生 成 器 对 象 拥 

有 _iter 和 _next 方法， 每 个 对 next _ 的 调用 都 会 从 上 次 停留 的 地 方 继续 执行 生成 
器 函数 ， 直 到 另 一 个 yield 语句 执行 的 地 方 。 








_next 第 一 次 调用 时 ， 程 序 从 letters_generator 的 函数 体 一 直 执 行 到 进入 yield 语句 。 
之 后 ， 它 暂停 并 返回 current 值 。 yield 语句 并 不 破坏 新 创建 的 环境 ， 而 是 为 之 后 的 使 用 保 
留 了 它 。 当 nexte 再 次 调用 时 2 执行 在 它 停 留 的 地 方 恢 复 ° Jletters_generator 作用 域 
中 current 和 任何 所 绑 定 名 称 的 值 都 会 在 随后 的 next_ _ 调用 中 保留 


我 们 可 以 通过 手动 调用 _next_() 来 遍历 生成 器 


>>> letters = letters_generator() 

>>> type(letters) 

<class 'generator '> 

>>> letters. next__() 

ey 

>>> letters. next__() 

5 

>>> letters. next__() 

a 

>>> letters. next__() 

sb 

>>> letters. next__() 

Traceback (most recent call last): 
File "<stdin>", line J In <module> 

StopIteration 


在 第 一 次 _next () 调用 之 前 ， 生 成 器 并 不 会 开始 执行 任何 生成 器 函数 体 中 的 语句 。 


5.2.4 可 和 迭代 对 象 


Python 中 ， 迁 4 次 底层 序列 的 元 素 。 在 遍历 之 后 ， 和 迭代 器 在 _next_() 调用 时 会 
产生 stopIteration 异常 。 许 多 应 用 需要 和 迭代 多 次 元 素 。 例 如 ， 我 们 需要 对 一 个 列表 和 迭代 多 次 
来 枚 举 所 有 的 元 素 偶 对 : 


or 
2 
阔 
入 
3 
1 


>>> "def all pairs(s): 
for item1l jn Ss: 
for item2 in s: 
yield (item1i, item2) 
>>> list(all pairs([1, 2, 3])) 
[Cy Ty (1, 2)， (1, 3), (2， 1), (2, 2), (2, 3), (3, 1), (3， 2 57 (3， 3)] 


序列 本 身 不 是 迭代 器 ， 但 是 它 是 可 和 迭代 对 象 。Python 的 可 和 迭代 接口 只 包含 一 个 消 

息 ，_ iter ， 返 回 一 个 迭代 器 。Python 中 内 建 的 序列 类 型 在 _iter ”方法 调用 时 ， 返 回 
ee 。 如 果 一 个 可 迭代 对 象 在 每 次 调用 _iter “时 返回 了 和 迭代 器 的 新 实例 ， 那 么 
它 就 能 被 迭代 多 次 。 


新 的 可 和 迭代 类 可 以 通过 实现 可 和 迭代 接口 来 定义 。 例 如 ， 下 面 的 可 和 迭代 对 象 LetterIterable 类 
在 每 次 调用 _ iter ee 回 新 的 迭代 器 来 迭代 字母 。 


>>> class lietter1iterable(object): 
def iter > /self): 
current = 'a' 
while current <= 'd': 
yield current 
current = chr(ord(current)+1) 


_iter “方法 是 个 生成 器 函数 ， 它 返回 一 个 生成 器 对 象 ， 产 出 从 'a' 到 'd' 的 字母 。 


Letters 器 对 象 在 单 次 迭代 之 后 就 被 "用 完 了， 但 是 LetterIterable 对 象 可 被 迭代 多 次 。 
所 以 ， LetterIterable 示例 可 以 用 于 all pairs 的 参数 。 


>>> letters = LetterIiterable() 
>>> all pairs(letters). next__() 
(a a) 


5.2.5 流 


流 提供 了 一 种 隐 式 表示 有 序数 据 的 最 终 方式 。 流 是 惰性 计算 的 递归 列表 。 就 像 第 三 章 
的 Rlist 类 那样 ， stream 实例 可 以 响应 对 其 第 一 个 元 素 和 剩余 部 人 的 区 本 全 。 同 
样 ， stream 的 剩余 部 分 还 是 stream 。 ， RList ， 流 的 剩余 部 分 只 在 查找 时 被 计算 
而 不 是 事先 存储 。 也 就 是 说 流 的 剩余 部 分 是 惰性 计算 的 。 


为 了 完成 这 个 情 性 求 值 ， 流 会 储存 计算 剩余 部 分 的 函数 。 无 论 这 个 函数 在 什么 时 候 调用 ， 它 
A ， 储存 在 叫做 _rest Reed o。 下划线 表示 它 不 应 直接 访问 。 可 
访问 的 属性 rest 是 个 方法 ， 它 返回 流 的 剩余 部 分 ， 并 在 必要 时 计算 它 。 使 用 这 个 设计 ， 流 可 


以 储存 计算 剩余 部 分 的 方式 ， NW 。 


>>> class Stream(object ) : 
AliazntyEcomputedErecusnVvelnsts 
def init (self, first, compute rest, empty=False): 
self.first = first 
self._ compute_rest = compute_rest 
self.empty = empty 
self._ rest = None 
self. computed = False 
@property 
def rest(self): 
”Return the rest of the stream, computing it If necessary.""™ 
assert not self.empty, 'Empty streams have no rest.' 
If not self._ computed: 
self._rest = self,._compute_rest() 
self. computed = True 
return self._rest 
def repr> (self): 
If self.empty: 
return '<empty stream>'" 
return 'Stream({0}, <compute_rest>)'.format(repr(self.first)) 
>>> Stream.empty = Stream(None, None, True) 


递归 列表 可 使 用 吝 套 表达 式 来 定义 。 例 如 ， 我 们 可 以 创建 RList ， 来 表达 1 和 5 的 序列 ， 像 
下 面 这 样 


>>> r = Rlist(1, Rlist(2+3, Rlist.empty)) 


与 之 类 似 ， 我 们 可 以 创建 一 个 stream 来 表示 相同 序列 。 stream 在 请 求 剩余 部 分 之 前 ， 并 不 
会 实际 计算 下 一 个 元 素 5 。 


>>> s = Stream(1, lambda: Stream(2+3, lambda: Stream.empty) ) 


这 里 ，1 是 流 的 第 一 个 元 素 ， 后 面 的 lambda 表达 式 是 用 于 计算 流 的 剩余 部 分 的 函数 。 被 计 
算 的 流 的 第 二 个 元 素 又 是 一 个 返回 空 流 的 函数 。 


访问 递归 列表 r 和 流 s 中 的 元 素 拥有 相似 的 过 程 。 但 是 ，5 储存 在 了 r 之 中 ， 而 对 于 s 来 
说 ， 它 在 首次 被 请 求 时 通过 加 法 来 按 要 求 计算 。 


>>> r.first 

下 

>>> s.first 

lL 

>>> r.rest.first 
3 

>>> s.rest.first 
5 

>>> r.rest 
Rlist(5) 

>>> s.rest 
Stream(5, <compute_rest>) 


当 make_integer_stream 首次 被 调用 时 ， 它 返回 了 一 个 流 ， 流 的 first 是 序列 中 第 一 个 整数 
(默认 为 1 ) 。 但 是 ，make_integer_stream 实际 是 递归 的 ， 因 为 这 个 流 的 compute_rest 以 
自 增 的 参数 再 次 调用 了 make_integer_stream ° 这 会 让 make_integer_stream 变 成 递归 的 ， 同 时 
也 是 惰性 的 。 


>>> ints.first 

和 

>>> ints.rest.first 

之 

>>> ints.rest.rest 
Stream(3, <compute_rest>) 


无 论 何 时 请 求 整数 流 的 rest ， 都 仅仅 递归 调用 make integer_stream 。 


操作 序列 的 相同 高 阶 函 数 -- map 和 filter -- 同样 可 应 用 于 流 ， 虽 然 它 们 的 实现 必须 修改 来 
情 性 调用 它们 的 参数 函数 。 map_stream 在 一 个 流 上 映射 函数 ， 这 会 产生 一 个 新 的 流 。 局 部 定 
义 的 compute_rest 函数 确保 了 无 论 什么 时 候 rest 被 计算 出 来 ， 这 个 函数 都 会 在 流 的 剩余 部 

分 上 映射。 


>>> def map _ stream(fn, s): 
if s.empty: 
elunmnmes 
def compute rest(): 
return map_stream(fn, s.rest) 
return Stream(fn(s.first), compute_rest) 


流 可 以 通过 定义 compute_rest 函数 来 过 滤 ， 这 个 函数 在 流 的 剩余 部 分 上 调用 过 滤器 函数 。 如 
果 过 滤器 苞 数 拒绝 了 流 的 第 一 个 元 素 2» 剩余 部 分 会 立即 计算 出 来 9 因为 filter_stream 是 递归 
的 ， 剩 余部 分 可 能 会 多 次 计算 直到 找到 了 有 效 的 first 元 素 。 


>>>>deffilter stream(Ofn sy): 
if s.empty: 
Pewnes 
def compute rest(): 
return filter_stream(fn, s.rest) 
工人 fn(Ss first): 
return Stream(s.first, compute_rest) 
return compute_rest() 


map_stream 和 filter_stream 展示 了 流 式 处 理 的 常见 模式 : 无 论 流 的 剩余 部 分 何 时 被 计算 ， 
局 部 定义 的 compute_rest 函数 都 会 对 流 的 剩余 部 分 递归 调用 某 个 处 理子 数 。 


为 了 观察 流 的 内 容 ， 我 们 需要 将 其 截断 为 有 限 长 度 ， 并 转换 为 Python 1list 。 


>>>defucruncateEsstreamtsSK) 
If s.empty or k == 0: 
return Stream.empty 
def compute_rest(): 
return truncate_stream(s.rest, k-1) 
return Stream(s.first, compute_rest) 
>>>adef ”stream to LiSt(S): 
= 
while not s.empty: 
r.append(s.first) 
S = s.rest 
LEE 大作 


这 些 便利 的 函数 允许 我 们 验证 map_stream 的 实现 ， 使 用 一 个 非常 简单 的 例子 ， 从 3 到 7 的 
整数 平方 。 


>>> S = make_integer_stream(3) 

S33S 

Stream(3, <compute_rest>) 

>>> m = map_stream(lambda x: x*x, Ss) 

>>> m 

Stream(9, <compute_rest>) 

>>> stream to_list(truncate_stream(m, 5)) 
[om 16、 25 36 9 


我 们 可 以 使 用 我 们 的 filter_stream 函数 来 定义 素数 流 ， 使 用 埃 拉 托 斯 特 尼 算法 (sieve of 
Eratosthenes) ， 它 对 整数 流 进行 过 滤 ， 移 除 第 一 个 元 素 的 所 有 倍数 数值 。 通 过 成 功 过 滤 出 每 
个 素数 ， 所 有 合 数 都 从 流 中 移 除 了 。 


>>> def primes(pos_streanm): 
def not divible(x): 
return x % pos_stream.first != 0 
def compute rest!(): 
return primes(filter_stream(not_divible, pos_stream.rest)) 
return Stream(pos_stream.first, compute_rest) 


通过 截断 primes 流 ， 我 们 可 以 枚 举 素数 的 任意 前 级 : 


>>> p1 = primes(make_integer_stream(2)) 
>>> stream to_list(truncate_stream(p1, 7)) 
[本 


流 和 和 迭代 器 不 同 ， 因 为 它们 可 以 多 次 传递 给 纯 函 数 ， 并 且 每 次 都 产生 相同 的 值 。 素 数 流 并 没 
有 在 转换 为 列表 之 后 “用 完 "”。 也 就 是 说 ， 在 将 流 的 前 缀 转换 为 列表 之 后 ， pi 的 第 一 个 元 素 仍 
旧 是 2 。 


>>> p1.first 


就 像 递归 列表 提供 了 序列 抽象 的 简单 实现 ， 流 提供 了 简单 、 元 数 式 的 递归 数据 结构 ， 它 通过 
高 阶 函 数 的 使 用 实现 了 惰性 求 值 。 


5.3 协 程 


这 篇 文章 的 大 部 分 专注 于 将 复杂 程序 解构 为 小 型 、 模 块 化 组 件 的 技巧 。 当 一 个 带 有 复杂 行为 
的 函数 逻辑 划分 为 几 个 独立 的 、 本 身 为 函数 的 步骤 时 ， 这 些 函 数 叫 做 辅助 函数 或 者 子 过 程 。 
子 过 程 由 主 函 数 调 用 ， 主 函数 负责 协调 子 函 数 的 使 用 。 


subroutine 
subroutine 


subroutine 
subroutine 
subroutine 





这 一 节 中 ， 我 们 使 用 协 程 ， 引 入 了 一 种 不 同 的 方式 来 解构 复杂 的 计算 。 它 是 一 种 针对 有 序数 
据 的 任务 处 理 方 式 。 就 像 子 过 程 那样 ， 协 程 会 计算 复杂 计算 的 一 小 步 。 但 是 ， 在 使 用 协 程 

时 ， 没 有 主 函 数 来 协调 结果 。 反 之 ， 协 程 会 自发 链接 到 一 起 来 组 成 流水 线 。 可 能 有 一 些 协 程 
消耗 输入 数据 ， 并 把 它 发 送 到 其 它 协 程 。 也 可 能 有 一 些 协 程 ， 每 个 都 对 发 送 给 它 的 数据 执行 

简单 的 处 理 步 又。 最 后 可 能 有 另外 一 些 协 程 输出 最 终结 果 。 


协 程 和 子 过 程 的 差异 是 概念 上 的 : 子 过 程 在 主 函 数 中 位 于 下 级 ， 但 是 协 程 都 是 平等 的 ， 它 们 
协作 组 成 流水 线 ， 不 带 有 任何 上 级 函数 来 负责 以 特定 顺序 调用 它们 。 


一 节 中 ， 我 们 会 学 到 Python 如 何 通过 yield 和 send() 语句 来 支持 协 程 的 构建 。 之 后 ， 我 
们 会 看 到 协 程 在 流水 线 中 的 不 同 作 用 ， 以 及 协 程 如 何 支持 多 任务 。 


5.3.1 Python 协 程 


在 之 前 一 节 中 ， 我 们 介绍 了 生成 器 函数 ， 它 使 用 yield 来 返回 一 个 值 。Python 的 生成 器 函数 
也 可 以 使 用 (yield) 语句 来 接受 一 个 值 。 生 成 器 对 象 上 有 两 个 额外 的 方 

法 : send() 和 close() ， 创 建 了 一 个 模型 使 对 象 可 以 消耗 或 产 出 值 。 定 义 了 这 些 对 象 的 生成 
器 前 数 叫 做 协 程 。 


协 程 可 以 通过 (yield) 语句 来 消耗 值 ， 向 像 下 面 这 样 : 


value = (yield) 


使 用 这 个 语法 ， 在 带 参数 调用 对 象 的 send 方法 之 前 ， 执 行 流 会 停留 在 这 条 语句 上 。 


coroutine.send(data) 


之 后 ， 执 行 会 恢复 ， value 会 被 赋 为 data 的 值 。 为 了 发 射 计算 终止 的 信号 ， 我 们 需要 使 
用 close() 方法 来 关闭 协 程 。 这 会 在 协 程 内 部 产生 GeneratorExit 异常 ， 它 可 以 
由 try/except 子 句 来 捕获 


下 面 的 例子 展示 了 这 些 概念 。 它 是 一 个 协 程 ， 用 于 打印 匹配 所 提供 的 模式 囊 的 字符 串 。 


>>> def match(pattern): 
print('Looking for ' + pattern) 
LEI 
Whileamrue 
s = (yield) 
if pattern in s: 
print(s) 
except GeneratorExit: 
print("=== Done ===") 


我 们 可 以 使 用 一 个 模式 串 来 初始 化 它 ， 之 后 调用 _next_() 来 开始 执行 : 


>>> m = match("Jabberwock") 
>>> m.__next__() 
Looking for Jabberwock 


对 next_() 的 调用 会 执行 函数 体 ， 所 以 "Looking for jabberwock" 会 被 打印 。 语 句 会 一 直 
持续 执行 ， 直 到 遇 到 line = (yield) 语句 。 之 后 ， 执 行 会 暂停 ， 并 且 等 待 一 个 发 送 给 m 的 
值 。 我 们 可 以 使 用 send 来 将 值 发 送 给 它 。 


>>> m.send("the Jabberwock with eyes of flame") 

the Jabberwock with eyes of flame 

>>> m.send("came whiffling through the tulgey wood") 
>>> m.send("and burbled as it came") 

>>> m.close() 
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当 我 们 以 一 个 值 调 用 m.send 时 ， 协 程 m 内 部 的 求 值 会 在 line = (yield) 语句 处 恢复 ， 这 里 

会 把 发 送 的 值 赋 给 line 变量 。m 中 的 语句 会 继续 求 值 ， 如 果 匹 配 的 话 会 打印 出 那 一 行 ， 并 

继续 执行 循环 ， 直 到 再 次 进入 line = (yield) 。 之 后 ，m 中 的 求 值 会 暂停 ， 并 在 m.send 调 

用 后 恢复 。 

我 们 可 以 将 使 用 send() 和 yield 的 函数 链 到 一 起 来 完成 复杂 的 行为 。 例 如 ， 下 面 的 函数 将 名 
为 text 的 字符 串 分 割 为 单词 ， 并 把 每 个 单词 发 送 给 另 一 个 协 程 。 

每 个 单词 都 发 送 给 了 绑 定 到 next_coroutine 的 协 程 2 使 next_coroutine 开始 执行 ， 而 且 这 个 
函数 暂停 并 等 待 。 它 在 next_coroutine 暂停 之 前 会 一 直 等 待 ， 随 后 这 个 函数 恢复 执行 ， 发 送 
下 一 个 单词 或 执行 完毕 。 

如 果 我 们 将 上 面 定 义 的 match 和 这 个 函数 链 到 一 起 ， 我 们 就 可 以 创建 出 一 个 程序 ， 只 打印 出 

匹配 特定 单词 的 单词 。 


>>> text = 'Commending spending is offending to people pending Jendingl!， 
>>> matcher = match('ending') 
>>> matcher. next__() 
Looking for ending 

>>> read(text, matcher) 
Commending 

spending 

offending 

pending 

lending! 

= 二 = 


read 函数 向 协 程 matcher 发 送 每 个 单词 ， 协 程 打 印 出 任何 匹配 pattern 的 输入 。 
在 matcher 协 程 中 ，s = (yield) 一 行 等 待 每 个 发 送 进来 的 单词 ， 并 且 在 执行 到 这 一 行 之 后 将 


控制 流 交 还 给 read 。 


read 






for loop( NV for Line in file: 上 


next_coroutine. send(line) od i 


send —— activate (yield) 
while True: 
line = (yietd) 
if pattern in line: 
print(Line) 


一 -一 match 


while Loop 


5.3.2 生产 、 过 滤 和 消耗 
协 程 基于 如 何 使 用 yield 和 send() 而 具有 不 同 的 作用 : 


send send send 


producer jj 


(yield) (yield) (yield) 


® 生产 者 创建 序列 中 的 物品 ， 并 使 用 send() ， 而 不 是 (yield) 。 
。 过 滤器 使 用 (yield) 来 消耗 物品 并 将 结果 使 用 send() 发 送 给 下 一 个 步骤 。 
。 消费 者 使 用 (yield) 来 消耗 物品 ， 但 是 从 不 发 送 。 


上 面 的 read 函数 是 一 个 生产 者 的 例子 。 它 不 使 用 (yield) ， 但 是 使 用 send 来 生产 数据 。 函 
数 match 是 个 消费 者 的 例子 。 它 不 使 用 send 人 ， 但 是 使 用 (yield) 来 消耗 数据 。 
我 们 可 以 将 match 拆 分 为 过 滤器 和 消费 者 。 过 滤器 是 一 个 协 程 ， 只 发 送 与 它 的 模式 相 匹配 的 
字符 串 。 


>>>”def mateohnefulten(pattern nex corouCineds 
print('Looking for ' + pattern) 
‘ln 
whaulee mn ue 
s = (yield) 
if pattern in s: 
next_coroutine.send(s) 
except GeneratorExit: 
next_coroutine.close() 


消费 者 是 一 个 函数 ， 只 打印 出 发 送 给 它 的 行 : 


>>> def print_consumer(): 
print('Preparing to print') 
ln 
while True: 
line = (yield) 
print(line) 
except GeneratorExit: 
print("=== Done ===") 


当 过 滤器 或 消费 者 被 构建 时 ， 必 须 调 用 它 的 “next “方法 来 开始 执行 : 


>>> printer = print_consumer() 

>>> printer, next__() 

Preparing to print 

>>> matcher = match_filter('pend', printer) 
>>> matcher. next__() 

Looking for pend 

>>> read(text, matcher) 

spending 

pending 

= 人 Done ee= = 


即使 名 称 filter 暗示 移 除 元 素 ， 过 滤器 也 可 以 转换 元 素 。 下 面 的 函数 是 个 转换 元 素 的 过 滤器 
的 示例 。 它 消耗 字符 串 并 发 送 一 个 字典 ， 包 含 了 每 个 不 同 的 字母 在 字符 囊 中 的 出 现 次 数 。 


>>> def count letters(next coroutine): 
ely 
whalee Tr ue 
s = (yield) 
counts = {letter:s.count(letter) for letter in set(s)} 
next_coroutine.send(counts) 
except GeneratorExit as e: 
next_coroutine.close() 


我 们 可 以 使 用 它 来 计算 文本 中 最 常 出 现 的 字母 ， 并 使 用 一 个 消费 者 ， 将 字典 合并 来 找 出 最 常 
出 现 的 键 。 


>>> def sum dictionaries(): 
total = {} 
ne 
whale mnues 
counts = (yield) 
for letter, count in counts.items(): 
total[letter] = count + total.get(letter, 0) 
except GeneratorExit: 
max_letter = max(total.items(), key=lambda t: t[1])[0] 
print("Most frequent letter: " + max_letter) 


为 了 在 文件 上 运 我 们 必须 首先 按 行 读 取 文 件 。 之 后 ， 将 结果 发 送 
ti ， 最 后 发 送 给 sum dictionaries 。 我 们 可 以 服用 read 协 程 来 读 取 文件 中 的 
行 


>>> s = Sum_dictionaries() 
>>> S, next__() 

>>> C = count_letters(s) 
>>> C, next__() 


>>> read(text, c) 
Most frequent letter: n 


5.3.3 多 任务 


生产 者 或 过 滤器 并 不 受 限 于 唯一 的 下 游 。 它 可 以 拥有 多 个 协 程 作为 它 的 下 游 ， 并 使 
用 send ( ) pn E 数据。 例如， 下面 是 read 的 一 个 版 本 ， 向 多 个 下 游 发 送 字 符 囊 中 的 单 
词 : 


>>>defireadtoumnany(Ltext coroutanes) 
for word in text.split(): 
for coroutine in coroutines: 
coroutine.send(word) 
for coroutine in coroutines: 
coroutine.close() 


我 们 可 以 使 用 它 来 检测 多 个 单词 中 的 相同 文本 : 


>>> m = match("mend") 
>>> m.__next__() 
Looking for mend 

>>> p = match("pe") 
>>> p, next__() 
Looking for pe 

>>> read_ to _ many(text, [m, p]) 
Commending 

spending 

people 

pending 

三 三 三 省 四 让 站 本 三 二 一 

= 二 DONe === 


首先 ， read_to_many 在 m 上 调用 了 send(word) ° 这 个 协 程 正在 等 待 循环 中 
的 text = (yield) ， 之 后 打印 出 所 发 现 的 匹配 ， 并 且 等 待 下 一 个 send 。 之 后 执行 流 返 回 到 
了 read to _ many ， 它 向 p 发 送 相 同 的 行 。 所 以 ， text 中 的 单词 会 按照 顺序 打印 出 来 。 


